T'SPACE

다채로운 에디터들의 이야기

728x90
반응형

컴퓨터공학 109

ADsP 데이터 분석 준 전문가 정리 3

https://tonnykang.tistory.com/256 ADsP 데이터 분석 준 전문가 정리 2https://tonnykang.tistory.com/255 ADsP 데이터 분석 준 전문가 정리 1데이터의 이해DIKW Pyramid데이터 Data정보 Information, 내포된 의미 → 유용하지 않을 수도 있음지식 Knowledge지혜 WidsomDataBase통합된 데이터 (tonnykang.tistory.com  데이터 분석 기획분석 대상과 그 방법에 따른 4가지 분석 주제최적화 Optimization - 문제, 분석법 둘다 앎솔루션 Solution - 문제만 알고 분석법 모름발견 Discovery - 둘다 모름통찰 Insight - 문제는 모르지만 분석법은 앎분석 기획 시 고려사항가용 데이터 ..

ADsP 데이터 분석 준 전문가 정리 2

https://tonnykang.tistory.com/255 ADsP 데이터 분석 준 전문가 정리 1데이터의 이해DIKW Pyramid데이터 Data정보 Information, 내포된 의미 → 유용하지 않을 수도 있음지식 Knowledge지혜 WidsomDataBase통합된 데이터 (Integrated data): 중복되지 않게 통합되어있다저장된 데이터 (Sttonnykang.tistory.com 빅데이터 활용 기본 테크닉 7가지1. 연관 규칙 학습 (Association Rule Learning)주목할 만한 상관 관계가 있는지 찾아내는 방법2. 유형분석 (Classification tree analysis)새로운 사건이 속할 범주를 찾아내는 방법3. 유전 알고리즘https://tonnykang.tist..

ADsP 데이터 분석 준 전문가 정리 1

데이터의 이해DIKW Pyramid데이터 Data정보 Information, 내포된 의미 → 유용하지 않을 수도 있음지식 Knowledge지혜 WidsomDataBase통합된 데이터 (Integrated data): 중복되지 않게 통합되어있다저장된 데이터 (Stored data): 컴퓨터가 접근 가능공용 데이터 (Shared data): 공동으로 이용할 수 있다변화하는 데이터 (Operational data): 삽입, 수정, 삭제 등다양한 측면에서의 특성-정보의 축적 및 전달 측면 : 기계 가독성, 검색 가능성, 원격 조작성-정보이용 측면-정보관리 측면-정보기술발전측면-경제, 산업적 측BigData더그 래니 3V데이터의 양 Volume데이터의 유형 Variety데이터의 생성 및 처리 속도의 증가 Velo..

Braess' Paradox와 스포츠에 적용된 Ewing Paradox

우리는 흔히 '더 많이', '더 좋게'가 항상 긍정적인 결과를 가져올 것이라고 생각합니다. 하지만 현실은 그리 단순하지 않죠. 때로는 무언가를 추가하는 것이 오히려 전체 시스템의 성능을 저하시키고, 핵심 요소를 제거하는 것이 더 나은 결과를 가져올 수 있습니다. 이러한 역설적인 상황을 잘 보여주는 두 가지 흥미로운 현상이 바로 Braess' Paradox와 Ewing Paradox입니다. Braess' Paradox: 더하기가 때론 빼기다Braess' Paradox는 1968년 독일의 수학자 Dietrich Braess가 발견한 현상입니다. 이 역설은 교통 네트워크에서 새로운 도로를 추가했을 때 오히려 전체적인 교통 흐름이 악화될 수 있다는 것을 보여줍니다.마치 Game Theory 와 비슷합니다예를 들..

Genetic Algorithm 유전 알고리즘

유전 알고리즘(Genetic Algorithm, GA) 자연세계의 진화과정 및 유전법칙에 기초한 계산 모델로서 존 홀랜드(John Holland)에 의해서 1975년에 개발된 전역 최적화 기법(Global Optimization Method)생물의 진화를 모방한 진화 연산의 대표적인 기법으로, 실제 진화의 과정에서 많은 부분을 차용하였으며, 변이(돌연변이), 교배 연산, 세대, 인구 등의 개념을 문제 풀이 과정에서 사용문제가 계산 불가능할 정도로 지나치게 복잡할 경우 유전 알고리즘을 통하여, 실제 최적해를 구하지는 못하더라도 최적해에 가까운 답을 얻을 수 있음 아래는 전반적인 GA의 과정이다 Starts with a population of individuals (다수의 개별 솔루션으로 시작)  Each..

NP, P, NP Complete, NP Hard problems 알고리즘

P, NP, NP-hard, NP-complete 문제의 이해컴퓨터 과학에서 가장 중요한 개념 중  하나인 P, NP, NP-hard, NP-complete 문제.이 개념들은 알고리즘의 효율성과 문제의 복잡성을 이해하는 데 핵심적이다.이 글에서는 각 개념을 자세히 살펴보겠습니다.P Problems (Polynomial)P 문제는 결정론적 튜링 기계(deterministic Turing machine)로 다항 시간(Polynomial Time) 내에 해결할 수 있는 문제이다 결정론적 알고리즘: 특정 입력이 주어지면 항상 같은 출력을 예측 가능한 단계 순서로 생성하는 알고리즘이다\즉 Heuristic한 알고리즘은 결정론적이지 않은 비결정론적 알고리즘이라고 할 수 있다 다항 시간: 알고리즘의 시간 복잡도가인 ..

Convex Hull Problem 컨벡스 헐

Convex Hull은 점들의 집합이 있을때 이 모든 점들을 포함하는 크기가 최소인 Convex Polygon을 찾는 문제이다Convexity 쉽게 말해 위처럼 집합 내에 있는 두 점을 연결한 선분이 집합 내에 있어야Convex하다고 할 수 있다하지만 우리가 찾는 것은 Convex Polygon 다각형임으로 모든 내각이 180도 이하라는 조건이 또 붙는다(180도는 각이 아님 ㅋ) 가장간단한 풀이 방법은 뭘까?? 좀 간지나게 mechanical way 라고 말하는데 2차원 평면에 수직되게 못을 점들과 대응되게 박아넣은뒤 고무줄을 늘려 풀어주면알아서 착! 감기며 Convex Hull 문제의 해를 구하게 된다 이렇게 시각적으로는 너무나 쉬운 내용이지많은 컴퓨터로 구현 혹은 알고리즘으로 정의 내리기가 매우 어..

String Matching Algorithms 문자열 매칭 알고리즘

문자열 처리는 컴퓨터 과학과 프로그래밍에서 매우 중요한 주제이다.특히, 특정 패턴을 텍스트 내에서 찾는 'Exact String Matching' 문제는 자주 등장하고 많은 분야에 활용된다. Exact String Matching 목표: 텍스트 문자열 T 내에서 패턴 문자열 P의 모든 출현 위치를 찾는 것.예: T = "AGCTTGAGCTTGA", P = "GCTTGA"라면, P는 T에서 두 번 index 1, 7에서 나타난다부분 문자열 (Substring)  vs Subsequence 부분 문자열(Substring): 원 문자열의 연속된 부분.S{i,j}=Si,S{i+1}...Sj예: S = "AGCTTGA"일 때, "GCT"는 부분 문자열.부분 수열(Subsequence):원 문자열에서 몇 개의 문자..

A* 알고리즘 (Dijkstra algorithm)

A* 알고리즘: 효율적인 경로 탐색을 위한 휴리스틱 기법 A* 알고리즘은 그래프에서 출발점부터 목표점까지의 최단 경로를 찾는 데 사용되는 휴리스틱 탐색 알고리즘이다.이 알고리즘은 Edsger W. Dijkstra의 최단 경로 알고리즘과 Best-First Search(최선 우선 탐색) 알고리즘의 아이디어를 결합하여 탐색 효율성을 높혀준다.A* 알고리즘의 기본 개념A* 알고리즘은 두 가지 주요 함수를 사용해 각 노드를 평가한다g(n): 출발점부터 현재 노드 n까지의 실제 비용 ->출발지에서 그 노드까지 비용h(n): 현재 노드 n부터 목표점까지의 예상 비용 (휴리스틱) ->그 노드에서 도착지 까지 비용 (예상)이 두 함수를 합한 f(n) = g(n) + h(n)이 각 노드의 평가 함수가 되며, A* 알고리..

Branch and Bound 분기 한정 알고리즘

https://tonnykang.tistory.com/224 Back Tracking 백트래킹 알고리즘백트래킹 알고리즘여러 다양한 방법을 순서대로 탑색하면서조건을 만족시키는 솔루션을 찾을 때 까지 되돌아가서 찾는 방법이다마치 미로를 탐색하는 것을 생각하면 되고탐색하다가 Promisingtonnykang.tistory.com백트래킹 알고리즘의 개선: 분기 한정법분기 한정법은 백트래킹 알고리즘을 개선한 방법으로, 각 노드에서 한계값(bound)을 계산하여 해당 노드가 유망한지 판단한다. 만약 한계값(bound)이 현재까지의 최적 해보다 좋지 않다면, 그 방향으로 탐색을 진행할 필요가 없음으로 필요없는 탐색을 줄일 수 있다.탐색 순서에는 크게 두가지가 있는데너비 우선 분기 한정법 (BF-Branch and B..

728x90
반응형