
6.1. Statistical Learning [ Learning에서는 Nonlinearity, X들 사이의 interaction (비선형끼리도) ]1. 정의 데이터를 이해하기 위한 vast/huge 도구들의 집합데이터를 조사하는 모든 과정은 통계적 학습의 과정으로 볼 수 있다. 항상 "예측"만이 목적인 것은 아니다.2. 지도 학습 vs 비지도 학습Supervised LearningXs=Ypredict y with Xs하나 이상의 입력에 기반하여 출력을 예측하거나 추정하기 위한 통계 모델을 구축한다.즉, 입력과 출력 간의 상호 관계를 다룬다.ex) 회귀 모델 (regression models)Unsupervised LearningCorrelations among Xs (cluster y)입력만 존재하고,..

5.1. Survival Data1. Survival data : 특정 사건이 발생하기까지의 시간은 관심 대상으로 하는 데이터. 응답변수는 종종 failure time, survival time, 또는 event time으로 불린다. 2. Survival Time Response -> 정규분포 아니다.보통 연속형 데이터이다.일부 대상에서는 완전히 관측되지 않을 수 있으며, 이 경우 censoring(검열)된 응답으로 간주한다.항상 0이상의 값을 가진다. 표준회귀분석의 한계검열이 없을 경우, 표준 회귀 분석을 사용할 수 있다. 하지만 생존 데이터의 특성상 적절하지 않을 수 있다. 왜냐하면a. 이벤트 시간이 항상 양수이고 비대칭이다.b. 특정 시점을 넘어 생존할 확률이 이벤트의 기대시간보다 더 중요한 경..

1. Ring1. Ring 링은 비어 있지 않은 집합으로, 2가지 이항연산( 덧셈과 곱셈)이 존재하는 구조이다. 집합 R이 링이 되기 위한 조건: 덧셈: 교환법칙, 결합법칙, 항등원 존재, 역원 존재 → abelian group 곱셈: 결합법칙, 분배법칙 Ring 예시: 정수, 유리수, 실수, 복소수, 정수 행렬은 덧셈과 곱셈이 정의된 Ring의 대표적 예시이다. 예를 들어, 정수에서는 2+3=5이고, 2*3=6이다. 이러한 연산에서 덧셈 항등원은 0이고, 곱셈 항등원은 1이다. 2. Commutative Ring with UnityCommutative Ring: 모든 a,b에 대해 ab=ba(곱셈의 교환법칙)이 성립하는 ringRing with Unity: R의 모든 원소에 대해 곱셈 항등원(u)이 존..

3.1. Regression data (회귀분석 데이터)1. 회귀 분석의 역사적 배경: 회귀분석(Regression Analysis)의 개념은 유전학 연구에서 유래했다. 2. 회귀분석의 정의회귀 분석은 변수 간 관계(relationship)의 특정 형태를 평가하는 통계적 절차이다. 한 변수(X or Xs)와 다른 변수(Y) 사이의 관계를 추정하거나 예측하는데 사용된다. 즉 x와 y의 연관성을 정확히 설명한다. 3. 회귀분석의 주요 개념종속변수 (Y) : 결과 변수 또는 반응 변수 . 분포(distribution)독립변수 (Xs): 설명 변수. Y에 영향을 미치는 변수. 변수(variable)Xs와 Y의 상관관계(correlations)/연관성(associations): 연구 설계에 따라 Xs가 Y에 미..

1. Group[덧셈에서의 역원은 더해서 0이되는것, 곱셈에서의 역원은 곱해서 1이되는것. 물론 최종 결과는 모듈러(나머지)정리한것!] 1. GroupGroup의 기본 조건: Closure(닫힘성), Associativity(결합법칙), Identity(항등원), Inverse(역원)2. Abelian GroupCommutative(교환법칙) 만족하는 group을 Abelian Group이라고 한다.는 abelian group이다.3. Zn∗ 은 Abelian Group이다.4. Order of Group (군의 차수) : 군 안에 포함된 원소의 개수, ∣G∣ Infinite Order(무한 차수) Zn의 차수 : {0,1,2....,n-1} , 집합 크기=nZp∗: 소수 p에 대해,..

1. Algebra, Group, Ring 1. Algebra(대수): 집합 K와 여러 연산자들로 이루어진 구조 : 실수 집합 R과 덧셈, 뺄셈, 곱셈, 나눗셈 같은 연산자들로 정의되는 구조: Boolean 대수에서 참(True)과 거짓(False)을 AND, OR, NOT으로 연산.K: 데이터의 집합으로 |K∣는 집합의 크기(유한 또는 무한)를 나타낸다.연산자 op: 단항(Unary, i=1), 이항(Binary, i=2)연산으로 나뉜다.("연산자"는 중요한 역할을 하는데, 연산자가 결합법칙이나 항등원 등의 성질을 만족시키는 지에 따라 다양한 수학적 구조로 구분한다.)2. Identity(항등원)와 Zero(영원)항등원은 어떤 연산 ⊕에 대해, 항등원 e는 e⊕a=a⊕e=a를 만족하는 원소{Z,+}에..

1.1. Basic ConceptsVariable (변수) : quantitative(양적), qualitative(질적)Random Variable(확률변수) : continuous(연속), discrete(이산)Population(모집단) Sample(표본집단)1. (Modern) Statistics : "일부 데이터"만을 관찰했을 때 전체 데이터에 대해 "추론"하는 것 → the drawing of inferences about a body of data when only a part of the data is observed. → Inference: Observe only a portion, Draw inforamtion on the whole. - BioStatistics: ident..
1. Apache POI 라이브러리 사용Apache POI는 엑셀 파일(.xlsx)을 읽고 쓰는 기능을 제공하는 라이브러리로, 엑셀 파일에서 셀 데이터를 읽거나 새로운 셀을 생성하는 등의 작업을 매우 쉽게 처리할 수 있다. 아래는 Gradle을 사용하여 POI 라이브러리를 프로젝트에 추가하는 방법이다.// POI 라이브러리 추가implementation 'org.apache.poi:poi-ooxml:5.3.0'implementation 'org.apache.commons:commons-compress:1.27.1' 이 라이브러리는 엑셀 파일의 다양한 포맷, 스타일을 지원하며, 셀의 데이터 형식을 유연하게 설정할 수 있다. 2. 엑셀 양식 생성엑셀 파일 생성 과정에서 각 열(Column)의 기본적인 데이터..