log-blog — 브라우저 히스토리를 블로그 포스트로 자동 변환하기

개요 매일 브라우저에서 수많은 기술 문서와 GitHub 레포를 탐색하지만, 그 과정은 기록되지 않고 사라진다. log-blog는 Chrome 브라우저 히스토리를 읽어서 Hugo 호환 블로그 포스트로 자동 변환하는 Python CLI 도구다. log-blog란? ice-ice-bear/log-blog는 “탐색 → 정리 → 공유"의 사이클을 자동화하는 도구다. Chrome의 SQLite 히스토리 DB에서 데이터를 추출하고, Playwright로 각 URL의 콘텐츠를 수집한 후, Hugo 호환 마크다운으로 변환하여 블로그 레포에 커밋한다. 파이프라인 구조 graph TD A[Chrome History SQLite DB] -->|extract| B[URL + Title + Timestamp JSON] B -->|AI classify| C[Tech vs Non-tech 분류] C -->|fetch| D[Enriched Content] D -->|AI write| E[Hugo Markdown Post] E -->|publish| F[Git Commit → GitHub Pages] 1단계: Extract — 히스토리 추출 log-blog extract --json --hours 24 Chrome의 SQLite 히스토리 DB에서 최근 N시간의 방문 기록을 추출한다. URL, 제목, 방문 횟수, 마지막 방문 시간을 JSON으로 출력한다. ...

2026-02-19 · 2 분 · ICE ICE BEAR

Tech Log: 2026-02-19

개요 오늘은 Hugo 블로그 테마를 본격적으로 탐색하며 블로그 리뉴얼을 구상했고, 바이브코딩 에센셜 책으로 Claude Code 활용법을 학습했다. AI 코딩 워크플로우를 강화하는 Archon이라는 새로운 도구도 발견했으며, Python의 비동기 SQLite 라이브러리인 aiosqlite도 살펴보았다. 주요 하이라이트 Hugo 테마 대탐험 — 블로그 리뉴얼을 위한 10개 테마 비교 블로그 리뉴얼을 위해 Hugo 테마 갤러리에서 다양한 테마를 집중 탐색했다. 총 10개의 테마를 직접 데모 사이트까지 방문하며 비교한 결과를 정리한다. 블로그용 테마: PaperMod (★13,116) — 가장 인기 있는 Hugo 테마. 빠르고 깔끔하며 반응형. Regular, Home-Info, Profile 3가지 모드를 지원하고, 다크/라이트 테마 자동 전환, SEO 최적화, Fuse.js 기반 검색 등 기능이 풍부하다. webpack이나 Node.js 같은 외부 의존성 없이 테마 수정이 가능하다는 점이 매력적이다. Stack (★6,261) — 카드 스타일의 블로거 친화적 테마. 시각적으로 세련된 레이아웃이 특징이며, 한/영/중 다국어 문서를 제공한다. GPL-3.0 라이선스. Coder (★3,031) — 심플하고 깔끔한 개인 블로그 테마. 다크모드 지원. MIT 라이선스. Terminal (★2,680) — 레트로 터미널 스타일. 개발자 감성을 좋아하는 사람에게 추천. 문서/포트폴리오용 테마: ...

2026-02-19 · 3 분 · ICE ICE BEAR

[혼공머신]7-1

인공 신경망 핵심 포인트: 인공 신경망(Artificial Neural Networks)은 생물학적 뉴런에서 영감을 받아 만든 머신러닝 알고리즘입니다. 하지만 실제 뇌를 모델링한 것은 아닙니다. 신경망은 이미지, 음성, 텍스트 처리와 같은 복잡한 문제에서 뛰어난 성능을 발휘하며, 종종 딥러닝(Deep Learning)이라고 불립니다. 코드 설명: # 인공 신경망에서의 랜덤성을 제어하여 재현 가능한 결과를 얻도록 설정합니다. import tensorflow as tf tf.keras.utils.set_random_seed(42) tf.config.experimental.enable_op_determinism() 이 코드는 텐서플로에서 재현 가능한 결과를 얻기 위해 난수 시드를 설정합니다. 이는 실험을 반복할 때마다 같은 결과를 얻을 수 있게 도와줍니다. ...

2024-08-18 · 3 분 · ICE ICE BEAR

[혼공머신]7-2

심층 신경망 (Deep Neural Networks) 심층 신경망은 두 개 이상의 층을 포함한 신경망으로, 이러한 구조는 입력 데이터의 복잡한 패턴을 학습할 수 있게 해줍니다. 각 층은 주로 여러 뉴런으로 구성되며, 각 뉴런은 이전 층의 모든 뉴런과 연결되어 있을 수 있습니다. 1. 심층 신경망 만들기 케라스(Keras)를 사용하여 심층 신경망을 만드는 방법은 간단합니다. 기본적으로 Sequential 모델을 사용하여 여러 층을 쉽게 추가할 수 있습니다. 각 층은 특정한 역할과 파라미터를 가지고 있으며, 예를 들어 Dense 층은 완전 연결 층을 의미합니다. ...

2024-08-18 · 3 분 · ICE ICE BEAR

[혼공머신]7-3

1. 손실 곡선 손실 곡선은 모델의 학습 과정에서 손실(loss) 값이 어떻게 변화하는지 보여주는 그래프입니다. 이 그래프를 통해 모델이 학습을 잘 하고 있는지, 과적합 또는 과소적합 문제가 발생하고 있는지 파악할 수 있습니다. 파일에서는 훈련 손실과 검증 손실을 시각화하는 코드가 포함되어 있으며, 이는 matplotlib 라이브러리를 사용해 그래프로 나타냈습니다. import matplotlib.pyplot as plt # 훈련 과정의 손실 및 검증 손실을 그래프로 표시 plt.plot(history.history['loss'], label='Training Loss') plt.plot(history.history['val_loss'], label='Validation Loss') plt.title('Training and Validation Loss') plt.xlabel('Epochs') plt.ylabel('Loss') plt.legend() plt.show() 설명: 위 코드는 matplotlib 라이브러리를 사용하여 훈련 손실과 검증 손실을 에포크별로 시각화합니다. history 객체에는 각 에포크마다 계산된 손실과 다른 메트릭스들이 저장되어 있으며, 이를 그래프로 그리면 모델의 학습 과정을 쉽게 파악할 수 있습니다. 2. 검증 손실 검증 손실은 모델이 새로운 데이터에 얼마나 잘 맞는지를 평가하기 위해 사용되는 지표입니다. 훈련 데이터와 별도로 준비된 검증 데이터셋에서 계산된 손실 값으로, 모델의 일반화 능력을 확인할 수 있습니다. 파일에는 검증 데이터셋을 사용하여 모델을 평가하는 과정이 코드로 구현되어 있습니다. ...

2024-08-18 · 3 분 · ICE ICE BEAR

[혼공머신]6-1

군집 알고리즘 1. 타깃을 모르는 비지도 학습 비지도 학습은 주어진 데이터에 대해 명시적인 타깃 레이블이 없는 상태에서 유용한 정보를 추출하는 머신러닝 기법입니다. 데이터의 구조나 패턴을 자동으로 인식하여 유사한 데이터물은 하나의 그룹(클러스터)으로 묶는 것이 일반적인 접근 방식입니다. 이러한 접근은 데이터의 숨겨진 특성이나 구조를 이해하는데 도움을 줍니다. 2. 과일 사진 데이터 준비하기 과일 사진 데이터를 사용하여 군집화를 실습하는 경우, 데이터 준비 과정은 다음과 같습니다: 데이터 수집: 다양한 종류의 과일 사진을 수집합니다. 이때, 각 과일의 이미지는 다양한 각도와 배경에서 촬영되어야 합니다. 이미지 전처리: 이미지 크기 조정, 색상 정규화, 필요한 경우 배경 제거 등의 전처리 작업을 수행합니다. 이는 알고리즘의 성능에 크게 영향을 미칠 수 있습니다. 데이터 세트 구성: 전처리된 이미지를 데이터 세트로 구성하여 알고리즘에 입력할 준비를 합니다. # 과일 데이터셋 다운로드 !wget https://bit.ly/fruits_300_data -O fruits_300.npy # 데이터셋 로드 fruits = np.load('fruits_300.npy') import matplotlib.pyplot as plt # 첫 번째 과일 이미지를 흑백으로 시각화 plt.imshow(fruits[0], cmap='gray') plt.show() 3. 픽셀값 분석하기 과일 사진의 픽셀 값을 분석하는 과정은 다음과 같습니다: ...

2024-08-11 · 2 분 · ICE ICE BEAR

[혼공머신]6-2

k-평균 (K-Means) k-평균 알고리즘은 비지도 학습에서 매우 흔히 사용되는 클러스터링 방법입니다. 이 알고리즘의 주 목적은 데이터를 k개의 클러스터로 그룹화하는 것이며, 각 클러스터는 서로 비슷한 특성을 가진 데이터 포인트들로 구성됩니다. 알고리즘의 기본적인 단계는 다음과 같습니다: 초기화: 먼저 클러스터의 수 ( k )를 정하고, 데이터 포인트들 중에서 무작위로 ( k )개의 포인트를 클러스터의 중심(센트로이드)으로 선택합니다. 할당: 각 데이터 포인트를 가장 가까운 센트로이드에 할당하여 클러스터를 형성합니다. 업데이트: 각 클러스터의 평균 위치로 센트로이드를 업데이트합니다. 이 할당과 업데이트 과정을 센트로이드의 변화가 없거나, 사용자가 설정한 최대 반복 횟수에 도달할 때까지 반복합니다. 이 알고리즘은 특히 대용량 데이터 세트에 효과적이며, 다양한 응용 분야에서 클러스터링을 위해 널리 사용됩니다. ...

2024-08-11 · 2 분 · ICE ICE BEAR

[혼공머신]6-3

주성분 분석 1. 차원과 차원 축소 차원의 개념 차원이란 데이터에서 각 특성(Feature)의 수를 의미합니다. 예를 들어, 사람의 키, 몸무게, 나이라는 3가지 특성을 가진 데이터는 3차원 데이터입니다. 차원 축소의 필요성 차원의 저주: 차원이 증가할수록, 각 차원에 걸쳐 데이터를 충분히 표현하기 위해 필요한 데이터 양이 기하급수적으로 증가합니다. 이로 인해 모델의 성능이 저하될 수 있습니다. 계산 효율성 및 시각화: 높은 차원의 데이터를 처리하는 것은 계산상의 비효율을 초래하며, 3차원 이상의 데이터는 직관적으로 이해하고 시각화하기 어렵습니다. 2. 주성분 분석 소개 PCA의 원리 주성분 분석은 데이터의 분산을 최대화하는 축을 찾아 데이터를 새로운 축에 투영함으로써 차원을 축소합니다. 이 때 새로운 축들은 서로 직교합니다. 주성분(Principal Components) 데이터의 분산이 최대인 방향을 찾아 그 방향으로 데이터를 투영한 것이 주성분입니다. 첫 번째 주성분은 데이터의 분산을 가장 많이 설명하고, 두 번째 주성분은 첫 번째 주성분에 직각이면서 다음으로 큰 분산을 설명하는 방향입니다. # 필요한 라이브러리를 불러옵니다. from sklearn.decomposition import PCA from sklearn.datasets import load_iris import matplotlib.pyplot as plt # Iris 데이터셋을 로드합니다. data = load_iris() X = data.data # PCA 모델을 생성하고 학습합니다. 이 때, 2개의 주성분만을 유지하도록 설정합니다. pca = PCA(n_components=2) X_pca = pca.fit_transform(X) # 변환된 데이터의 분포를 시각화합니다. plt.figure(figsize=(8, 6)) plt.scatter(X_pca[:, 0], X_pca[:, 1], c=data.target, cmap='viridis') plt.xlabel('First principal component') plt.ylabel('Second principal component') plt.title('PCA result of Iris Dataset') plt.colorbar() plt.show() 3. PCA 클래스 (scikit-learn) 주요 매개변수 n_components: 축소할 차원의 수를 지정합니다. 기본적으로는 None으로 설정되며, 이 경우 더 적은 수의 주성분으로 설정됩니다. random_state: 결과의 일관성을 위한 난수 시드를 설정합니다. 주요 속성 components_: 추출된 주성분의 방향 벡터입니다. explained_variance_: 각 주성분에 의해 설명된 분산의 양입니다. explained_variance_ratio_: 전체 분산에 대한 각 주성분의 분산 비율입니다. # PCA 객체의 주요 속성을 출력합니다. print("Components (Principal axes):", pca.components_) print("Explained variance:", pca.explained_variance_) print("Explained variance ratio:", pca.explained_variance_ratio_) 4. 원본 데이터 재구성 PCA 변환 후, inverse_transform() 메서드를 사용하여 축소된 차원에서 원본 차원으로 데이터를 복원할 수 있습니다. 이 과정에서 일부 정보 손실이 발생하지만, 주요 특성은 유지됩니다. # 차원 축소된 데이터를 원래의 차원으로 복원합니다. X_inverse = pca.inverse_transform(X_pca) # 원본 데이터와 복원된 데이터의 비교를 위해 시각화합니다. plt.figure(figsize=(8, 6)) plt.scatter(X[:, 0], X[:, 1], alpha=0.2, label='Original') plt.scatter(X_inverse[:, 0], X_inverse[:, 1], alpha=0.8, label='Recovered') plt.legend() plt.title('Comparison of Original and Recovered Data') plt.show() 5. 설명된 분산 설명된 분산은 PCA에서 각 주성분이 데이터 전체 분산에서 얼마나 많은 부분을 차지하는지를 나타내는 지표입니다. 높은 설명된 분산 비율은 주성분이 데이터의 중요한 정보를 많이 포함하고 있음을 의미합니다. 6. 다른 알고리즘과 함께 사용하기 PCA는 다른 기계학습 알고리즘 전에 데이터를 전처리하는 단계로 사용될 수 있습니다. 차원이 축소된 데이터는 학습 속도를 향상시키고, 과적합을 방지하는 효과가 있습니다. 예를 들어, 고차원 데이터에 대해 SVM, 로지스틱 회귀 등을 적용하기 전에 PCA로 차원을 축소하는 것이 일반적입니다. from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split # PCA를 적용한 데이터로 로지스틱 회귀 모델을 학습합니다. X_train, X_test, y_train, y_test = train_test_split(X_pca, data.target, test_size=0.2, random_state=42) model = LogisticRegression() model.fit(X_train, y_train) # 모델의 정확도를 평가합니다. print("Test accuracy:", model.score(X_test, y_test))

2024-08-11 · 3 분 · ICE ICE BEAR

[혼공머신]5-1

결정 트리의 정확도를 높이기 위한 방법 1. 가지치기 (Pruning) 가지치기는 트리의 불필요한 가지를 제거하여 과대적합을 방지하는 방법입니다. 사전 가지치기 (Pre-pruning): max_depth: 트리의 최대 깊이를 제한합니다. min_samples_split: 노드를 분할하기 위한 최소 샘플 수를 지정합니다. min_samples_leaf: 리프 노드가 가져야 하는 최소 샘플 수를 지정합니다. max_leaf_nodes: 리프 노드의 최대 개수를 제한합니다. model = DecisionTreeClassifier(max_depth=5, min_samples_split=10, min_samples_leaf=5, random_state=42) model.fit(X_train, y_train) 사후 가지치기 (Post-pruning): 사후 가지치기는 트리가 생성된 후 가지를 잘라내는 방법입니다. scikit-learn에서 직접 제공하지는 않지만, 트리를 생성한 후 수동으로 가지를 잘라낼 수 있습니다. 2. 앙상블 방법 (Ensemble Methods) 여러 개의 결정 트리를 사용하여 예측을 개선하는 방법입니다. ...

2024-07-28 · 2 분 · ICE ICE BEAR

[혼공머신]5-1-2

결정 트리 (Decision Tree) 결정 트리는 예/아니오에 대한 질문을 통해 데이터를 분류하거나 예측하는 데 사용되는 알고리즘입니다. 이해하기 쉽고, 예측 과정도 투명하게 드러나기 때문에 매우 유용한 도구입니다. 핵심 포인트 불순도 (Impurity): 결정 트리는 데이터를 나눌 때, 각 분할이 얼마나 순수한지를 평가합니다. 사이킷런은 지니 불순도와 엔트로피 불순도를 제공합니다. 불순도는 노드의 순수도를 나타내는 척도로, 낮을수록 더 순수합니다. 정보 이득 (Information Gain): 정보 이득은 부모 노드와 자식 노드의 불순도 차이로 정의됩니다. 결정 트리는 정보 이득이 최대화되도록 학습합니다. 과대적합 (Overfitting): 결정 트리는 트리가 너무 깊어지면 훈련 데이터에 과대적합될 수 있습니다. 이를 방지하기 위해 가지치기 (Pruning)을 사용합니다. 사이킷런은 여러 가지 가지치기 매개변수를 제공합니다. 특성 중요도 (Feature Importance): 결정 트리는 각 특성이 분할에 기여한 정도를 계산할 수 있습니다. 이는 모델의 해석성을 높여주는 중요한 장점입니다. 결정 트리 알고리즘 이해하기 결정 트리 알고리즘은 데이터 분류와 회귀 문제를 해결하는 데 사용됩니다. 예/아니오와 같은 질문을 반복하여 데이터를 분할하며, 최종적으로 목표 변수의 예측을 돕습니다. 아래는 결정 트리의 시각화와 이를 읽는 방법에 대한 설명입니다. ...

2024-07-28 · 3 분 · ICE ICE BEAR