{{ message }}
10.ML_with_Python
Directory actions
More options
Directory actions
More options
10.ML_with_Python
Folders and files
파이썬 라이브러리를 활용한 머신러닝 - 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서 - 안드레아스 뮐러 , 세라 가이도 (한빛미디어) #################################################### Contens CHAPTER 1 소개 1.1 왜 머신러닝인가? __1.1.1 머신러닝으로 풀 수 있는 문제 __1.1.2 문제와 데이터 이해하기 1.2 왜 파이썬인가? 1.3 scikit-learn __1.3.1 scikit-learn 설치 1.4 필수 라이브러리와 도구들 __1.4.1 주피터 노트북 __1.4.2 NumPy __1.4.3 SciPy __1.4.4 matplotlib __1.4.5 pandas __1.4.6 mglearn 1.5 파이썬 2 vs. 파이썬 3 1.6 이 책에서 사용하는 소프트웨어 버전 1.7 첫 번째 애플리케이션: 붓꽃의 품종 분류 __1.7.1 데이터 적재 __1.7.2 성과 측정: 훈련 데이터와 테스트 데이터 __1.7.3 가장 먼저 할 일: 데이터 살펴보기 __1.7.4 첫 번째 머신러닝 모델: k-최근접 이웃 알고리즘 __1.7.5 예측하기 __1.7.6 모델 평가하기 1.8 요약 CHAPTER 2 지도 학습 2.1 분류와 회귀 2.2 일반화, 과대적합, 과소적합 __2.2.1 모델 복잡도와 데이터셋 크기의 관계 2.3 지도 학습 알고리즘 __2.3.1 예제에 사용할 데이터셋 __2.3.2 k-최근접 이웃 __2.3.3 선형 모델 __2.3.4 나이브 베이즈 분류기 __2.3.5 결정 트리 __2.3.6 결정 트리의 앙상블 __2.3.7 커널 서포트 벡터 머신 __2.3.8 신경망(딥러닝) 2.4 분류 예측의 불확실성 추정 __2.4.1 결정 함수 __2.4.2 예측 확률 __2.4.3 다중 분류에서의 불확실성 2.5 요약 및 정리 CHAPTER 3 비지도 학습과 데이터 전처리 3.1 비지도 학습의 종류 3.2 비지도 학습의 도전 과제 3.3 데이터 전처리와 스케일 조정 __3.3.1 여러 가지 전처리 방법 __3.3.2 데이터 변환 적용하기 __3.3.3 훈련 데이터와 테스트 데이터의 스케일을 같은 방법으로 조정하기 __3.3.4 지도 학습에서 데이터 전처리 효과 3.4 차원 축소, 특성 추출, 매니폴드 학습 __3.4.1 주성분 분석(PCA) __3.4.2 비음수 행렬 분해(NMF) __3.4.3 t-SNE를 이용한 매니폴드 학습 3.5 군집 __3.5.1 k-평균 군집 __3.5.2 병합 군집 __3.5.3 DBSCAN __3.5.4 군집 알고리즘의 비교와 평가 __3.5.5 군집 알고리즘 요약 3.6 요약 및 정리 CHAPTER 4 데이터 표현과 특성 공학 4.1 범주형 변수 __4.1.1 원-핫-인코딩(가변수) __4.1.2 숫자로 표현된 범주형 특성 4.2 구간 분할, 이산화 그리고 선형 모델, 트리 모델 4.3 상호작용과 다항식 4.4 일변량 비선형 변환 4.5 특성 자동 선택 __4.5.1 일변량 통계 __4.5.2 모델 기반 특성 선택 __4.5.3 반복적 특성 선택 4.6 전문가 지식 활용 4.7 요약 및 정리 CHAPTER 5 모델 평가와 성능 향상 5.1 교차 검증 __5.1.1 scikit-learn의 교차 검증 __5.1.2 교차 검증의 장점 __5.1.3 계층별 k-겹 교차 검증과 그외 전략들 5.2 그리드 서치 __5.2.1 간단한 그리드 서치 __5.2.2 매개변수 과대적합과 검증 세트 __5.2.3 교차 검증을 사용한 그리드 서치 5.3 평가 지표와 측정 __5.3.1 최종 목표를 기억하라 __5.3.2 이진 분류의 평가 지표 __5.3.3 다중 분류의 평가 지표 __5.3.4 회귀의 평가 지표 __5.3.5 모델 선택에서 평가 지표 사용하기 5.4 요약 및 정리 CHAPTER 6 알고리즘 체인과 파이프라인 6.1 데이터 전처리와 매개변수 선택 6.2 파이프라인 구축하기 6.3 그리드 서치에 파이프라인 적용하기 6.4 파이프라인 인터페이스 __6.4.1 make_pipleline을 사용한 파이프라인 생성 __6.4.2 단계 속성에 접근하기 __6.4.3 그리드 서치 안의 파이프라인 속성에 접근하기 6.5 전처리와 모델의 매개변수를 위한 그리드 서치 6.6 모델 선택을 위한 그리드 서치 6.7 요약 및 정리 CHAPTER 7 텍스트 데이터 다루기 7.1 문자열 데이터 타입 7.2 예제 애플리케이션: 영화 리뷰 감성 분석 7.3 텍스트 데이터를 BOW로 표현하기 __7.3.1 샘플 데이터에 BOW 적용하기 __7.3.2 영화 리뷰에 대한 BOW 7.4 불용어 7.5 tf–idf로 데이터 스케일 변경하기 7.6 모델 계수 조사 7.7 여러 단어로 만든 BOW(n-그램) 7.8 고급 토큰화, 어간 추출, 표제어 추출 __7.8.1 (한국어판 부록) KoNLPy를 사용한 영화 리뷰 분석 7.9 토픽 모델링과 문서 군집화 __7.9.1 LDA 7.10 요약 및 정리 CHAPTER 8 마무리 8.1 머신러닝 문제 접근 방법 __8.1.1 의사 결정 참여 8.2 프로토타입에서 제품까지 8.3 제품 시스템 테스트 8.4 나만의 추정기 만들기 8.5 더 배울 것들 __8.5.1 이론 __8.5.2 다른 머신러닝 프레임워크와 패키지 __8.5.3 랭킹, 추천 시스템과 그 외 다른 알고리즘 __8.5.4 확률 모델링, 추론, 확률적 프로그래밍 __8.5.5 신경망 __8.5.6 대규모 데이터셋으로 확장 __8.5.7 실력 기르기 8.6 마치며
