[원티드_프리온보딩]1.확률 및 통계 핵심개념 정리

확률 및 통계 핵심개념 정리 확률 및 확률분포 확률(Probability) 확률(Probability): 특정 사건이 일어날 가능성을 0에서 1 사이의 값으로 나타내며, 사건이 발생할 확률이 높을수록 1에 가까워집니다. $$ 0 \leq P(A) \leq 1 $$ 여기서 $ P(A) $는 사건 $ A $가 발생할 확률을 나타냅니다. 표본공간(Sample Space, $ S $): 모든 가능한 결과의 집합입니다. 예를 들어, 주사위를 던졌을 때의 표본공간은 ${1, 2, 3, 4, 5, 6}$입니다. 사건(Event): 표본공간의 부분집합으로, 특정한 결과나 결과들의 집합을 나타냅니다. 예를 들어, 짝수가 나오는 사건은 ${2, 4, 6}$입니다. ...

2024-08-13 · 4 분 · ICE ICE BEAR

[원티드_프리온보딩]2.선형대수 핵심개념 정리

선형대수 핵심개념 정리 행렬 (Matrix) 행렬(Matrix): 수 또는 다항식을 직사각형 배열로 나타낸 것으로, 행과 열로 구성됩니다. 행렬은 데이터의 변환, 시스템의 표현, 기하학적 변환 등을 나타내는 데 사용됩니다. 예시: 실수 1, 9, -13, 20, 5, -16을 2행 3열의 직사각형 형태로 배열한 행렬. $$ A = \begin{bmatrix} 1 & 9 & -13 \ 20 & 5 & -16 \end{bmatrix} $$ 행렬은 다양한 연산이 가능하며, 예를 들어 두 행렬 ( A )와 ( B )의 곱셈은 다음과 같이 정의됩니다. $$ C = AB = \begin{bmatrix} a_{11} & a_{12} \ a_{21} & a_{22} \end{bmatrix} \begin{bmatrix} b_{11} & b_{12} \ b_{21} & b_{22} \end{bmatrix} = \begin{bmatrix} a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \ a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \end{bmatrix} $$ ...

2024-08-13 · 3 분 · ICE ICE BEAR

[원티드_프리온보딩]3.컴퓨터공학 핵심개념 정리

컴퓨터공학 핵심개념 정리 객체지향 프로그래밍 (Object-Oriented Programming, OOP) 객체지향 프로그래밍(OOP): 프로그램을 객체라는 단위로 구성하여 소프트웨어를 설계하는 방법론입니다. 객체는 데이터와 그 데이터를 처리하는 함수를 하나의 단위로 묶은 것입니다. 주요 개념: 클래스(Class): 객체를 생성하기 위한 청사진으로, 속성과 메서드를 정의합니다. 객체(Object): 클래스의 인스턴스로, 실제로 메모리에 할당된 구조입니다. 상속(Inheritance): 기존 클래스를 확장하여 새로운 클래스를 생성하는 기능으로, 코드 재사용성을 높입니다. 다형성(Polymorphism): 동일한 인터페이스나 메서드를 통해 다른 동작을 수행할 수 있는 기능입니다. 캡슐화(Encapsulation): 객체의 속성과 메서드를 하나로 묶고, 외부에서 접근을 제한하여 데이터 보호를 강화합니다. 관계형 데이터베이스 (RDBMS)와 SQL 관계형 데이터베이스(RDBMS): 데이터를 테이블 형식으로 저장하며, 데이터 간의 관계를 설정하여 효율적으로 관리합니다. 각 테이블은 고유한 키를 가지고 있으며, 이를 통해 다른 테이블과의 관계를 정의합니다. ...

2024-08-13 · 4 분 · ICE ICE BEAR

[원티드_프리온보딩]4.머신러닝 핵심개념 정리

머신러닝 핵심개념 정리 데이터 전처리 (Data Preprocessing) 데이터 전처리는 머신러닝 프로젝트의 기초 단계로, 데이터를 분석 가능하고 의미 있게 만드는 과정입니다. 데이터 전처리는 전체 데이터 과학 프로세스의 80%를 차지할 정도로 중요합니다. Anthony Goldbloom에 따르면, 데이터 과학자들은 대부분의 시간을 데이터 클리닝과 전처리에 사용하며, 이는 머신러닝 모델의 성능에 직접적인 영향을 미칩니다. 데이터의 특성과 문제점 특성/문제점 정의 발생 원인 해결 방법 잡음 (Noise) 랜덤 에러나 측정된 변수의 변형된 값 센서의 작동 실패, 데이터 전송 문제 회귀 분석, 클러스터링을 통한 노이즈 제거 결측값 (Missing Value) 데이터 수집 과정에서 누락된 값 데이터 입력 누락, 데이터 수집 오류 평균값, 중앙값 대체 또는 행/열 삭제 이상값 (Outlier) 데이터의 정상적인 범위를 벗어난 값 입력 오류, 측정 오류, 실험 조건의 불일치 시각화를 통한 탐지, 통계적 방법을 통한 처리 불일관성 다양한 출처에서 수집된 데이터의 형식 및 단위 차이 데이터 형식 및 단위의 차이 형식과 단위를 일관되게 맞추기 데이터 전처리 기술 데이터 전처리 기술을 사용하여 위의 특성과 문제점을 해결합니다. 이러한 기술은 데이터의 품질을 높이고 머신러닝 모델의 성능을 개선하는 데 필수적입니다. ...

2024-08-13 · 4 분 · ICE ICE BEAR

[원티드_프리온보딩]5.딥러닝 핵심개념 정리

딥러닝 핵심 개념 정리 딥러닝은 인공신경망을 기반으로 하여 대량의 데이터를 처리하고 학습하는 기계 학습의 한 분야입니다. 여러 계층(layer)으로 구성된 신경망을 통해 복잡한 패턴을 학습할 수 있습니다. 아래는 딥러닝의 핵심 개념을 표와 수식, 그래프를 사용하여 자세히 정리한 것입니다. 딥러닝의 기본 개념 인공신경망 (Artificial Neural Network) 인공신경망은 뇌의 신경망을 본떠 만든 구조로, 입력 계층, 은닉 계층, 출력 계층으로 구성됩니다. 각 계층은 뉴런(노드)으로 이루어져 있으며, 뉴런 간에는 가중치(weight)가 연결되어 있습니다. 퍼셉트론 (Perceptron) 구성 요소: 입력, 가중치, 활성화 함수 수식: $$ \text{Output} = f\left(\sum_{i=1}^{n} w_i \cdot x_i + b\right) $$ 여기서 $ w_i $는 가중치, $x_i$는 입력값, $b$는 편향(bias), $f$는 활성화 함수입니다. 다층 퍼셉트론 (Multi-Layer Perceptron, MLP) ...

2024-08-13 · 4 분 · ICE ICE BEAR