본문 바로가기

분류 전체보기158

[Model Evaluation] 분류 모델 평가 방법에 대해 알아보자 (Accuracy, precision, RecallROC, F1Score, AUC-ROC curve, logistic loss) 본 포스팅은 Ouassim Adnane의 Kaggle Notebook 'Machine Learning Model Evaluation Metrics'를 기반으로 작성되었습니다. 단순히 이론은 학습하는 것이 아닌 실습을 통해 모델을 평가하는 연습을 충분히 갖는 시간이 되었으면 합니다. 안녕하세요 Steve-Lee입니다. 이번 시간에는 '머신러닝 모델 평가 및 해석 방법'에 대한 첫 번째 시간으로 분류 모델(Classification Model)에 대한 평가 방법을 알아보도록 하겠습니다. 분류 모델 평가 실습은 Kaggle Notebook를 통해서 가능합니다. 그럼 시작하겠습니다. 본 포스팅에 대한 튜토리얼은 아래의 링크에서 진행하실 수 있습니다 [Model Evaluation] 1. Classificatio.. 2021. 2. 25.
[Model Evaluation] 머신러닝 모델 평가 및 해석방법 (feat. Imbalanced Data는 어떻게 평가할 수 있을까?) Overview 모델 평가 및 해석 (Model Evaluation & Interpretation) 안녕하세요 Steve-Lee입니다. 오랜만에 인사드립니다. 데이터 분석, 데이터 과학, 머신러닝, 딥러닝을 공부한 이례로 수많은 모델을 직접 만들어보고 모델의 성능을 평가해봤습니다. 하지만 정작 제가 한 모델의 성능이 어떤 성능을 가지고 있는지, 얼마만큼 유용한지에 대한 고민이 적었던 것 같습니다. 특히 어떤 한계점이 있는지, 어떻게 개선해야 할지 등을 깊게 고민해본 적이 없는 것 같다는 생각을 하게 되었습니다. 그래서 오늘 '머신러닝 모델 평가 및 해석 방법'에 대해 고민해보고 자세히 하나씩 알아보려고 합니다. Kaggle을 막 시작한 Beginner로써 그리고 앞으로 데이터 과학자이자 분석가로 활동할 .. 2021. 2. 25.
1만시간의 재발견 '몰입' - 시늉하지 말고 몰입하라 안녕하세요 Steve-Lee입니다. 다들 주말 잘 보내셨나요? 오늘은 1만 시간의 재발견(안데르슨 에릭슨 저)의 제6장 일상생활에서 활용하는 '의식적 연습' 중 '시늉하지 말고 몰입하라'라는 절에 대한 리뷰를 남기고자 합니다. 책을 읽기 전 '어떻게 하면 일상생활 속에서도 1만 시간의 연습을 할 수 있을까'라는 물음을 가졌습니다. 또한 '지금 내가 제대로 하고 있는 게 맞나'라는 물음을 갖기도 했습니다. 이번 독서를 통해 일상생활에서 의식적인 연습을 하기 위해서 어떻게 해야 하는지 한 번 생각해볼 수 있었으며 그동안의 연습과정에 대한 성찰을 할 수 있었습니다. 그리고 조금은 더 개선된 방안을 찾아야되겠다는 다짐을 했습니다. 그러면 시작하겠습니다. 본 리뷰는 '1만 시간의 재발견 (안데르슨 에릭슨 저)'를.. 2021. 2. 22.
[스토리텔링 머신러닝] 1. 머신러닝에 동작 원리(feat. Decision Tree) Introduction This micro-course will have you build models as you go through following scenario Kaggle Micro-Course는 Scenario에 기반한 스토리텔링을 통해 머신러닝의 개념을 소개합니다. 여기서 아이디어를 얻어 '스토리텔링 머신러닝' 콘텐츠를 기획하게 되었습니다. 오늘은 첫 번째 시간으로 머신러닝 모델의 동작 원리와 활용에 대해 간단히 살펴보도록 하겠습니다 머신러닝 모델이 어떻게 동작하고 사용되는지 알아보도록 하겠습니다 여러분이 statistical modeling 또는 머신러닝을 전에 공부하셨다면 다소 쉽게 느껴지실 수 있다고 생각합니다 하지만 걱정 마세요. 곧 파워풀한 모델들도 다뤄보도록 하겠습니다 제 블로그.. 2021. 2. 3.
[협업을 위한 git & GitHub] 2. 다른 사람의 원격 저장소로부터 협업하는 방법(Fork, clone, upstream, Pull Request, Merge & Pull) 안녕하세요 Steve-Lee입니다. 오늘은 '협업을 위한 git & GitHub' 두 번째 시간으로 다른 사람의 원격 저장소(Remote Repository)를 가져와 협업하는 방법에 대해 다뤄보도록 하겠습니다. (내용이 조금 많을 수 있습니다 ^^) 그럼 시작하겠습니다! 제 블로그의 글이 도움이 되셨다면 좋아요와 댓글 부탁드리겠습니다.글을 지속적으로 작성하는데 많은 동기부여가 됩니다. 감사합니다. 오늘도 편안한 하루 보내세요!🙏 [협업을 위한 git & GitHub] 1. 직관적으로 이해하는 git & GitHub 본 정리노트는 투빅스 10기 정윤호의 Git강의와 강의자료를 바탕으로 작성되었습니다. 안녕하세요 Steve-Lee입니다. 오늘은 '협업을 위한 git & GitHub' 첫 번째 시간으로 gi.. 2021. 2. 2.
[scikit-learn] transform()과 fit_transform()의 차이는 무엇일까? 왜 scikit-learn에서 모델을 학습할 때, train dataset에서만 .fit_transform()메서드를 사용하는 건가요? TL;DR 안녕하세요 steve-lee입니다. 실용 머신러닝 A to Z 첫번 째 시간은 scikit-learn에서 자주 사용하는 transform(), fit_transform() 메서드와 관련된 질문에 대한 답을 찾아가는 시간입니다. 시작하며 오늘의 주제는 scikit-learn의 transfrom() 메서드와 fit_transform() 메서드의 차이를 알아보는 것입니다 우리는 Machine Learning 프로젝트 또는 Kaggle 등을 할 때, 머신러닝을 위한 파이썬 프로그래밍 라이브러리로 scikit-learn을 많이 사용합니다 scikit-learn을 사용하.. 2021. 2. 1.