T'SPACE

다채로운 에디터들의 이야기

728x90
반응형

컴퓨터공학 112

Pre Order Post Order Tree Traversal 전위 후위 순회

트리 순회 (Tree Traversal)는 트리 자료구조의 모든 노드를 체계적으로 방문하는 방법입니다. 자주 사용되는 BFS와 DFS 알고리즘과 함께, 깊이 우선 순회의 두 가지 일반적인 유형은 전위(pre-order) 와 후위(post-order) 순회입니다. 각각에 대한 설명을 해드리겠습니다: 전위 순회정의:전위 순회에서는 다음 순서로 노드를 방문합니다:루트 노드 (root node)를 방문합니다.왼쪽 서브트리 (subtree)를 순회합니다 (재귀적(으로 전위 순회 사용).오른쪽 서브트리를 순회합니다 (재귀적으로 전위 순회 사용).이진 트리(Binary Tree)의 경우:현재 노드를 처리합니다 (예: 값을 출력).왼쪽 서브트리에 대해 재귀적으로 전위 순회를 수행합니다.오른쪽 서브트리에 대해 재귀적으로..

ROUGE 점수 (Recall-Oriented Understudy for Gist Evaluation)

ROUGE는 자동 생성된 텍스트의 품질을 평가하는 중요한 지표로, 특히 텍스트 요약이나 기계 번역 같은 자연어 생성 작업에서 널리 사용됩니다. ROUGE의 기본 원리는 매우 직관적입니다. 기계가 생성한 텍스트를 사람이 직접 작성한 '정답' 텍스트와 비교하여, 둘 사이의 유사도를 측정합니다. 이때 여러 가지 관점(다양한 종류의 ROGUE 점수)에서 평가를 진행하는데, 각각의 평가 방식이 서로 다른 특징을 가지고 있어 함께 사용될 때 더욱 의미 있는 평가가 가능합니다. 가장 기본이 되는 ROUGE-1(R1)부터 살펴보겠습니다. ROUGE-1 (R1) ROUGE-1(R1)은 개별 단어의 일치도를 측정합니다. 예를 들어, 생성된 요약문과 참조 요약문에서 같은 단어가 얼마나 많이 등장하는지를 확인합니다. 이는 가..

알고리즘 배열의 기본 개념

자료구조는 크게메모리 공간 기반의 연속 (contiguous)방식포인터 기반의 연결 (link)방식으로 나뉜다 배열은 이중에서 연속 방식의 가장 기본이 되는 자료형이다↔ 연결방식의 가장 기본이 되는 자료형은 ‘연결 리스트’가 있다배열을 C언어 기준으로 설명해드리자면, 크기를 지정하고 해당 크기만큼 연속된 메모리 공간을 할당받는 작업을 수행하는 자료형을 말한다.크기가 정해져 있으며, 한번 생성한 배열은 크기를 변경하는 것이 불가능 하다int arr[5] = {4, 7, 29, 0, 1};물리 메모리, 즉 실제 메모리에는 이 배열 요소의 값들이 순서대로 배치된다과거에는 16비트 컴퓨터 시절에 int는 2바이트였지만,현대 32비트 이상의 시스템에는 int가 일반적으로 4바이트이다.무엇보다 배열은 어느 위치에서..

데이터 베이스 정규화 Normalization

Schema Decomposition 위 이미지는 Schema Decompositon의 예제이다 예상하시다 시피, 스키마를 분해하는데에는 엄청나게 많은 방법이 있다. 그러면 많은 방법들 중, 좋은 분해는 어떻게 해야하냐? Minimze RedundancyAvoid Information Loss (Lossless-join)Preserve the FDs (Dependency Preserving)Ensure good query performance위 조건들을 만족 시키는게 이상적인데 더 자세하게 살펴보자 Lossless-JoinsInformation Loss위와 같이 테이블을 분해하면, 원본 테이블로 복구하는 것은 불가능하다즉, 정보 손실이 일어난 샘이다 그래서 정보 손실이 없는 Join을 수행하려하는데Inf..

데이터 베이스 설계 이론 Design Theory

데이터베이스 SQL문도 공부하느라 정신 없는데 설계이론 까지 공부해야하느냐? 아래 시나리오들을 살펴보자 다음은 제대로 설계되지 못한 데이터베이스의 예시이다위와 같이 Student, Course, Room 이 있는 테이블이 있다 하자예시에는 한개의 수업만 있지만 여러수업이 있고 여러수업이 다 한 강의실에서 강의를 하면Redundant Storage, 쓸모 없는 저장 공간을 차지하게 된다 Update Anomaly수업 한개의 강의실 하나를 업데이트하면 Inconsistent 한 Data를 가지게 된다 Insert Anomaly 또한 한 강의에 대한 정보를 입력하려하는데위와 같이 Student에 데이터가 없으면 테이블에 Tuple을 추가할 수가 없다. Delete Anomaly한 강의에 또한, 모든 학생들이 ..

데이터 베이스 권한 Authorization

DB에서느 모든 유저들이 아무짓이나 하도로 허락되지 않는다 특정 유저들은 특정 권한을 가지며 이걸 privilege라고 부른다 이러한 privilege는 Database Administrator (DBAs)들로 부터 부여된다 GRANTselect/insert/update/delete/all 위 내용들이 유저들에게 주어질 수 있는 권한들이다 아래와 같은 문법으로 부여 가능하다grant update (budget) on departmentto faculty;SelectRelation내 Tuple들을 Read 할 수 있는 권한을 주는 Authorization UpdateRelation내 아무 Tuple을 Update할 수 있도록 하게 해주는 Authorization-> 그러나 모든 Tuple에게 Update권..

데이터베이스 Transaction 트랜잭션

Transaction(TXN)은 한개 이상의 Operation들의 Sequence이다 (Read or Write) 왜 이런 Transaction의 정의가 필요하나?실제 현실에서는어떤 일은 일어나거나 안일어난다 그 중간은 없다 내가 화나서 친구를 한대 때리고싶다 치자화나서 참으면 내가 안때린거다1대를 때리거나 안떄리거나이지, 0.5대를 때릴 수는 없다0.5배의 힘으로 때리는건.... 그것도 1대다 ㅋㅋㅋㅋ 그래서 프로그램에서는 여러 statement들을 묶어서 Transaction으로 만들 수 있다 START TRANSACTION; UPDATE Bank SET amount = amount - 100 WHERE name = 'bob'; UPDATE Bank SET amount = amount +100 W..

데이터베이스 제약조건 Integrity Constraints

Integrity Constraint는 데이터베이스에 실수로 피해를 주지 않게 만들어 놓은 제약조건들입니다 -> 데이터 일관성 Data Consistency를 유지하기 위함이죠 그래서 실생활 예시들로는- 은행 계좌는 잔고가 0원 이상이여야한다- 은행 직원은 시급이 5000원 이상이여야한다- 고객들의 번호 형식은 000-0000-0000 이여야 한다 등이 있다 그래서 제약조건은 크게 2가지로 분류 할 수 있는데요 한 Relation을 대상으로:not nullprimary keyuniqueCheck(c) c:condition여러 Relation들을 대상으로foreign keys그래서 복합적으로 활용되는 SQL 코드를 확인해보면CREATE TABLE employees( id INT, first_name VAR..

데이터베이스 뷰 View

데이터베이스에서는 모든 유저가 아무 데이터나 접근하게 허락하는 것은 좋은 구조가 아닙니다기밀내용이 있을 수도 있거나단순하게 일반 유저들에게 너무 데이터가 많아 복잡할 수도 있습니다그래서 예를들어 누군가 강사의 성함이랑 부서를 알고싶어하지만굳이 강사의 급여를 공개할 필요가 없을 때 에는아래처럼 SELECT문을 사용하면 되는데Select id, name, dept_namefrom instructor;-> 실제 테이블 (relation)이 아닌 가상의 relation은 view라고 합니다 하지만 실제로 View를 어떻게 정의하는지 알아볼까요CREATE VIEW V AS  이 형식의 SQL로 하면되는데 위의 시나리오 같은 경우 어떻게 되는지 봅시다create view faculty asselect id, nam..

분류기 성능지표들과 ROC Curve, Confusion Matrix

Confusion Matrix분류기 (Classifier) 는 Positive - False 로 이루어진 이진적인 데이터를 옳게 분류하는 모델이다 분류기가 한 예측은 맞거나(True) 틀리거나(False) 중 하나이다 그래서 모든 결과들을 테이블로 만들어둔게 Confusion Matrix이다 TP: True PositiveFP: False PositiveFN: False NegativeTN: True Negative AccuracyAccuracy는 정확도라고 하는데분류기가 예측한 것들중에서 실제로 맞춘 것들의 비율이다Accuracy가 1 이면 모든 데이터에 대해 옳게 정답을 내는 분류기이다 PrecisionPrecision은 분류기가 Positive라고 한 놈들 중실제로 정답이 Positive라고 예측 ..

728x90
반응형