핸즈온 머신러닝 예제

이것은 데이터 과학자 / 기계 학습 엔지니어가 재무 도메인과 함께 일하거나 계획하는 또 다른 흥미로운 기계 학습 프로젝트 아이디어입니다. 주가 예측은 회사의 실적에 대해 학습하고 미래의 주가를 예측하는 시스템입니다. 주가 데이터 작업과 관련된 과제는 매우 세분화되어 있으며 변동성 지수, 가격, 글로벌 거시 경제 지표, 기본 지표 등과 같은 다양한 유형의 데이터가 있다는 것입니다. 주식 시장 데이터 로 작업할 때 좋은 점은 금융 시장이 피드백 주기를 단축하여 데이터 전문가가 새로운 데이터에 대한 예측을 쉽게 검증할 수 있다는 것입니다. 주식 시장 데이터 작업을 시작하려면 조직의 분기 보고서에서 기본 지표를 기반으로 6개월 가격 변동을 예측하는 것과 같은 간단한 기계 학습 문제를 선택할 수 있습니다. Quandl.com 또는 Quantopian.com 주식 시장 데이터 집합을 다운로드할 수 있습니다. 저자 인 Aurélien Géron은 구체적인 예제, 최소한의 이론 및 두 개의 프로덕션 준비 파이썬 프레임워크(scikit-learn)와 TensorFlow를 사용하여 지능형 시스템을 구축하기 위한 개념과 도구를 직관적으로 이해할 수 있도록 도와줍니다. 간단한 선형 회귀에서 시작하여 심층 신경망으로 진행하는 다양한 기술을 배울 수 있습니다. 배운 내용을 적용하는 데 도움이 되는 각 장의 연습을 통해 프로그래밍 환경을 시작하기만 하면 됩니다.

웹에서 예제의 대부분은 일반적으로 리눅스 또는 맥을 기반으로 하지만 내 레 노 버 윈도우에이 데모를 했다 10 인텔 core7 기계. 따라서 아래의 모든 개인 경험 및 지침은 Windows 환경에서 사용하기에 적합합니다. 감독 학습에서 알고리즘에 공급하는 교육 데이터에는 레이블이라는 원하는 솔루션이 포함됩니다(그림 1-5). 일괄 학습 시스템이 새 데이터(예: 새 유형의 스팸)에 대해 알고 자하는 경우 전체 데이터 집합(새 데이터뿐만 아니라 이전 데이터)에서 새 버전의 시스템을 처음부터 학습한 다음 이전 시스템을 중지하고 새로운 것. 해결 된 코드 예제에 대한 무료 액세스는 여기에서 찾을 수 있습니다 (이들은 프로젝트에 즉시 사용됩니다) 대부분의 반 감독 학습 알고리즘은 감독되지 않은 알고리즘과 감독된 알고리즘의 조합입니다. 예를 들어, 딥 신념 네트워크(DBN)는 서로 겹치면 제한된 Boltzmann 컴퓨터(RBM)라는 감독되지 않은 구성 요소를 기반으로 합니다. RBM은 감독되지 않은 방식으로 순차적으로 학습된 다음 감독된 학습 기술을 사용하여 전체 시스템을 미세 조정합니다. 기계 학습 시스템을 분류하는 한 가지 방법은 기계 학습 시스템을 일반화하는 방법입니다. 대부분의 기계 학습 작업은 예측을 수행하는 것입니다. 즉, 여러 가지 교육 예제를 감안할 때 시스템은 이전에 본 적이 없는 예제로 일반화할 수 있어야 합니다.