λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
Life/Road to Character

[2020-05(May) 30Days Challenge] - ν•œλ‹¬ 살이 μ‹œμž‘! Try DataScience 30Days!

by Steve-Lee 2020. 5. 7.

Photo by  Kristopher Roller  on  Unsplash

Goal

  • 20.05.07.Thur ~ 20.06.07.Sun
    • cs231n Lecture 7, 8, 9, 10, 11, 12, 13, 14
    • cs231n Assignment 1,2

πŸ“Œ Check

  • cs231n Lecture 12, 13, 14
  • cs231n Assignment 1 

ν•œ 달 λ™μ•ˆ cs231n을 끝μž₯λ‚΄λŠ” 게 λͺ©ν‘œλ‹€.

μˆ˜μ•„ 랩의 μ΄ν˜Έμ„± λ‹˜κ»˜μ„œ μ—°μ‚¬λ‹˜μœΌλ‘œ μ˜€μ…”μ„œ 강연을 ν•˜μ…¨μ„ λ•Œ cs231n을 10번 λ΄€λ‹€κ³  ν•˜μ…¨λ‹€. 

이번 μŠ€ν„°λ””λ₯Ό κ³„κΈ°λ‘œ 10번 이상 λ³΄λŠ” 게 λͺ©ν‘œλ‹€.


  • 5μ›” 14일 진행상황(Update)
    • cs231n Lecture 8 μŠ€ν„°λ”” λ°œν‘œ
    • Lecture 7 Review 및 μŠ€ν„°λ”” ν•„μš”
    • Assignment 2-4 λ§ˆμ € κ΅¬ν˜„ν•˜κΈ° - Dead Line 5/24(일)

βœ… cs231n Lecture 8 μŠ€ν„°λ”” λ°œν‘œ (전달이 λΆ€μ‘±ν•œ 것 κ°™μ•„ 아쉬움이 λ‚¨λŠ”λ‹€. λ‹€μŒ μ„Έλ―Έλ‚˜ λ•Œ Lecture11은 전달에 μ’€ 더 μ‹ κ²½ 써보도둝 ν•˜κ² λ‹€


  • 5μ›” 17일 진행상황(Update)
    • Kaggle Kernel을 파기 μ‹œμž‘ν–ˆλ‹€
      • μ—„μ²­λ‚œ κΉ¨λ‹¬μŒμ„ μ–»μ—ˆλŠ”λ° Data뢄석은 μ±…μœΌλ‘œ ν•˜λŠ” 것보닀 Kaggle Competition을 따라 ν•΄ λ³΄λŠ” 게 훨씬 더 곡뢀가 잘 λ˜λŠ” 것 κ°™λ‹€(λ¬Όλ‘  μ‹œμž‘μ΄ μ‰¬μ›Œμ„œ 그런 것 κ°™λ‹€)
      • μ—°κ΅¬μ‹€μ—μ„œ 12μ›” μ •λ³΄λ³΄ν˜Έ ν•™νšŒ Data Challengeλ₯Ό μ€€λΉ„ν•˜μžλŠ” μ·¨μ§€λ‘œ μ‹œμž‘ν–ˆλŠ”λ° μ—¬λŸ¬λͺ¨λ‘œ μ‹€λ ₯을 μŒ“μ„ 수 μžˆλŠ” 쒋은 기회라고 μƒκ°ν•œλ‹€
      • Kaggle의 μ‹œμž‘μ€ Titanic...!! λΈ”λ‘œκ·Έμ—λ„ μ—…λ°μ΄νŠΈ ν•˜λ„λ‘ ν•˜κ² λ‹€

  • 5μ›” 18일
    • cs231n
      • Lecture 6, Lecture7, Training Neural Net을 λ‹€μ‹œ λ¦¬λ·°ν•˜κ³  μžˆλ‹€.
      • (λ‹€μ‹œ κ³΅λΆ€ν•˜λ©΄μ„œ) μƒˆλ‘­κ²Œ λŠκ»΄μ§€λŠ” 뢀뢄듀이 λ§Žμ€ 것을 λ³΄λ‹ˆ 전에 μ œλŒ€λ‘œ μ΄ν•΄ν•˜κ³  λ„˜μ–΄κ°€μ§€ μ•Šμ•˜λ˜ 뢀뢄듀이 μžˆμ—ˆλ˜ 것 κ°™λ‹€λŠ” 생각을 ν•œλ‹€.
      • Lecture 6의 Batch Normκ³Ό Babysitting Learning을 내일 μ˜€μ „μ— 맑은 μ •μ‹ μœΌλ‘œ 정리해야지!
      • 이번 μ£Ό μˆ˜μš”μΌμ€ Lecture 9(Architecture), 10(RNN)에 Assignment 2-5(PyTorch)인데... μ‹œκ°„μ΄ μ°Έ... 금방 κ°„λ‹€ γ… γ… 
    • Data Analysis
      • Kaggle
        • ν˜„μž¬μ‹œκ°„ 11μ‹œ 05λΆ„, λ‹€κ°€μ˜€λŠ” 미래λ₯Ό μœ„ν•΄ 데이터 λΆ„μ„μ˜ 기초λ₯Ό λ‹¦λŠ” μ‹œκ°„μ„ ν•œ μ‹œκ°„ κ°–κ³  μž μ„ μ²­ν•˜κ³ μž ν•œλ‹€
        • 퇴근 ν›„ λ³΄λ‚΄λŠ” 이 μ‹œκ°„λ§ŒνΌ ν•˜λ£¨ λ™μ•ˆ 자유둜운 μ‹œκ°„μ€ μ—†λ‹€ 
    • ν•œνŽΈ...
      • μ΄λ ‡κ²Œ λ¬Έμž₯이 ν•œμ€„ν•œμ€„ λŠ˜μ–΄κ°€λŠ” 게 λ„ˆλ¬΄ 기뢄이 μ’‹λ‹€
      • λ³΅μž‘ν•œ 일상듀이 μ •λ¦¬λ˜λŠ” λŠλ‚Œμ΄κ³  무엇보닀 동기뢀여가 λœλ‹€

  • 5μ›” 30일 (ν† )
    • μ •μ‹ μ°¨λ €λ³΄λ‹ˆ 벌써 5μ›”μ˜ λ§ˆμ§€λ§‰ 날이 λ‹€κ°€μ˜€κ³  μžˆλ‹€
    • μ§€λ‚œ ν•œ μ£ΌλŠ” μŠ€ν„°λ”” cs231n Lecture 11 λ°œν‘œ μ€€λΉ„ν•˜λŠλΌ 평일은 λ‹€ 보낸 것 κ°™λ‹€
    • μŠ€ν„°λ””κ°€ λλ‚˜λ‹ˆ μ‘Έμ—… μ‹œν—˜λ„ ν•œ κ³Όλͺ© λ΄€κ³ ... λ‹€μŒμ£Όμ— ν•˜λ‚˜ 더 λ³Έλ‹€... ν•˜ν•˜
  • cs231n - Generative Adversarial Network
    • λ“œλ””μ–΄ GAN이닀!
    • 이번 κΈ°νšŒμ— AE, VAE, GAN을 ν™•μ‹€ν•˜κ²Œ ν•œ 번 μ •λ¦¬ν•˜λŠ” 게 λͺ©ν‘œμ΄λ‹€
  • Kaggle Micro Course
    • μ§€λ‚œλ²ˆ Pandasμ΄ν›„λ‘œ λ°”μ˜λ‹€λŠ” ν•‘κ³„λ‘œ μ œλŒ€λ‘œ 손을 λͺ» λŒ€κ³  μžˆλ‹€.
    • 이번 주말을 μ΄μš©ν•΄ Pandasλ₯Ό Review ν•˜κ³ , Visualization, Feature EngineeringκΉŒμ§€ λ³΅μŠ΅ν•˜κ³ μž ν•œλ‹€.
      • Self-Check
        • Pandas Tutorial(Done 05.30)
        • Visualization(Start 05.30~)
        • Feature Engineering
    • λ‹€μŒ μ£ΌλŠ” 평일 μ˜€ν›„ μ‹œκ°„μ„ μ΄μš©ν•΄μ„œ Titanic, Boston House Price Kernel을 κ³΅λΆ€ν•˜κ³ μž ν•œλ‹€.
    • μ•„λ§ˆ Boston Hose Price만 ν•˜κ²Œ λ˜μ§€ μ•Šμ„κΉŒ...

βœ… cs231n Image Seminar - Segmentation, Localization, Detection에 λŒ€ν•œ 주제λ₯Ό λ°œν‘œν–ˆλ‹€. 

CNN으둜 이미지 λΆ„λ₯˜λ₯Ό λ„˜μ–΄ λ‹€μ–‘ν•œ Taskλ₯Ό ν•΄κ²°ν•  수 μžˆλ‹€λŠ” 것을 λ°°μ› λŠ”λ° μ•žμœΌλ‘œκ°€ μƒλ‹Ήνžˆ κΈ°λŒ€λ˜λŠ” 뢀뢄이닀.

βœ… μ‘Έμ—… μ‹œν—˜ ν•œ κ³Όλͺ© - 이번 주에 λ‹€ 봀으면 μ’‹μ•˜μ„ 텐데... μ½”λ‘œλ‚˜λ‘œ 인해 일정듀이 λ„ˆλ¬΄ 많이 κΌ¬μ˜€λ‹€...


  • 5μ›” 31일 (일)
    • λ‚˜λ₯Έν•œ 주말이닀
    • μ°½λ°–μ˜ 곡기가 μ΄λ ‡κ²Œ μƒμΎŒν–ˆμ„κΉŒ 싢을 μ •λ„λ‘œ λ°”κΉ₯ 날씨가 무척 쒋은 것 κ°™λ‹€
    • μ˜€λŠ˜μ€ Kaggle House Price - EDAλ₯Ό λ§ˆμ € νŒŒλŠ” 게 λͺ©ν‘œλ‹€
    • Kaggle House Price EDA Git hub
  • ν•œνŽΈ...
    • μ˜€λŠ˜λ„ λ°”κΉ₯은 κ³ μš”ν•œ λ“―ν•˜λ©΄μ„œλ„ ν˜Όλž€μŠ€λŸ½λ‹€
    • ν•˜λ£¨λΉ¨λ¦¬ 쒋은 날이 μ™”μœΌλ©΄ μ’‹κ² λ‹€

  • 6μ›” 2일 (ν™”)
    • 밖은 μ—¬μ „νžˆ λ’€μˆ­μˆ­ν•˜λ‹€
    • μ–΄μ œμ €λ…μ„ 늦게 λ¨Ήμ–΄μ„œμΌκΉŒ... μ•„λ‹ˆλ©΄ λͺΈμ΄ ν”Όκ³€ν•΄μ„œμΌκΉŒ 기운이 쑰금 μ—†λ‹€
  • μ •λ³΄λ³΄ν˜Έ ν•™νšŒ ν•˜κ³„ ν•™μˆ λŒ€νšŒ
    • 이번 μ •λ³΄λ³΄ν˜Έ ν•™νšŒ ν•˜κ³„ ν•™μˆ λŒ€νšŒ 'μœ΅ν•©λ³΄μ•ˆ'에 νˆ¬κ³ ν•  논문을 써야 ν•œλ‹€(κΈˆμš”μΌκΉŒμ§€)
    • μ£Όμ œλŠ” 기쑴에 ν•˜κ³  있던 Deep Learning 기반 Malware Classification의 ν™•μž₯판이며
    • GAN을 μ μš©ν•œ Feature Extraction 및 Embedding Networkλ₯Ό ν†΅ν•œ λΆ„λ₯˜λ₯Ό ν•˜κ³ μž ν•œλ‹€
  •  μ˜€λŠ˜ ν•  일
    • μ–΄μ œ ν•˜λ˜ Tutorial을 λ§ˆμ € λλ‚΄λ³΄μž!
    • μ‰½κ²Œ 써진 GAN
    • 1μ‹œκ°„ λ‚΄λ‘œ 마무리λ₯Ό 짓고 cs231n GAN κ°•μ˜λ₯Ό λ“€μœΌλ©° κ°œλ…μ μΈ 뢀뢄도 μ±„μ›Œλ‚˜κ°€κ³  μ‹Άλ‹€
    • μ €λ…μ—λŠ” 사전 접속 Testκ°€ μžˆλ‹€λŠ” 것을 μžŠμ§€ 말자!(μ„œλ²„ 문제둜 미뀄짐)

 

 πŸŒ‘ ν…œν¬κ°€ 살짝 μ³μ§€λŠ” λŠλ‚Œμ΄ 없지 μ•Šλ‹€.

λ„ˆλ¬΄ μš•μ‹¬λΆ€λ¦¬μ§€ 말고 λ‚΄κ°€ ν•  수 μžˆλŠ” μΌλ§ŒνΌμ€ μ΅œμ„ μ„ λ‹€ν•΄λ³΄μž!

✏️ 였늘 ν•˜λ£¨λ„ Few-shot을 λ‚ λ €λ³΄μž!!


  • 6μ›” 3일 (수)
    • ν•˜λ£¨ν•˜λ£¨κ°€ μ†Œμ€‘ν•˜λ‹€
  • μ •λ³΄λ³΄ν˜Έ ν•™νšŒ ν•˜κ³„ ν•™μˆ λŒ€νšŒ
    • μ–΄μ œ 정리해둔 페이퍼λ₯Ό ν•˜λ‚˜μ”© κ²©νŒŒν–ˆλ‹€
    • Malware Classification for Non-Domain ExpertλΌλŠ” Paperλ₯Ό μ΄μ–΄μ„œ 정리해야 ν•œλ‹€
  • Kaggle House Price: 
    • 였늘 ν•œ 번 끝μž₯을 내보렀고 ν•œλ‹€
    • μ˜€ν›„μ— 산책도 ν–ˆκ³  저녁에 κ±΄κ°•ν•œ μŒμ‹λ„ λ¨Ήμ—ˆλ‹€
    • 자기 μ „κΉŒμ§€ 주의 μ§‘μ€‘ν•΄λ³΄μž

  • HTML Color
    • Blue - #3688FE

Summary

  • μ •μ‹ μ—†μ—ˆλ˜ ν•œ 달이 μ§€λ‚˜κ°”λ‹€.
  • λ‚΄κ°€ κ°€μž₯ μ’‹μ•„ν•˜λŠ” 5월은 μ˜¬ν•΄λ„ λ§Žμ€ 선물을 μ•ˆκ²¨μ£Όμ—ˆλ‹€.
  • κ°„λ‹¨ν•˜κ²Œ ν•œ 달을 λŒμ•„λ³΄μž

 

01. cs231n Seminar

  • νˆ¬λΉ…μŠ€ 동아리원듀과 ν•¨κ»˜ cs231n을 본격적으둜 κ³΅λΆ€ν–ˆλ‹€.
  • μž‘λ…„ 말에 λ² μ΄μŠ€κ°€ ν•˜λ‚˜λ„ μ—†λ˜ μƒνƒœμ—μ„œλŠ” λŒ€λΆ€λΆ„μ˜ λ‚΄μš©λ“€μ„ ν˜λ €λ“€μ—ˆμ—ˆλŠ”λ° μ΄λ²ˆμ—λŠ” 쑰금 μ•Œ 것 κ°™λ‹€.
  • κ·ΈλŸ¬λ‚˜ μ—¬μ „νžˆ μ–΄λ €μš΄ 뢀뢄이 있고, 정볡해야 ν•  산듀이 λ‚¨μ•„μžˆλ‹€.
  • 이번 Seminarλ₯Ό ν•˜λ©΄μ„œ λ†“μ³€λ˜ λΆ€λΆ„λ“€κ³Ό μƒˆλ‘œ κ³΅λΆ€ν•œ λ‚΄μš©λ“€μ„ ν•˜λ‚˜μ”© ν¬μŠ€νŒ…ν•˜λŠ” 게 λͺ©ν‘œλ‹€(6μ›” λͺ©ν‘œλ‘œ 이어지면 μ’‹κ² λ‹€)

πŸ“Œ Check by myself

  • cs231n Lecture 12, 13, 14
  • Assignment 1

02. Data Science From Scratch

  • κΈ°λŒ€μΉ˜ μ•Šμ•˜λ˜ μ„œλ₯˜ ν•©κ²©μœΌλ‘œ Data Analytics ν•„κΈ°μ‹œν—˜μ„ μ€€λΉ„ν•˜κ²Œ λ˜μ—ˆλ‹€.
  • Data Science의 기본을 μ œλŒ€λ‘œ λ‹¦λŠ” 것이 μ€‘μš”ν•˜λ‹€λŠ” νŒλ‹¨ν•˜μ— PandasλΆ€ν„° λ‹€μ‹œ 곡뢀λ₯Ό μ‹œμž‘ν–ˆλ‹€.
  • 결과적으둜 ν•„κΈ°μ‹œν—˜μ—μ„œ λ§Žμ€ 뢀쑱함을 느끼며 κ³ λ°°λ₯Ό λ§ˆμ…¨μ§€λ§Œ λ‚΄κ°€ μ§€μ›ν•˜κ³ μž ν•˜λŠ” μ§κ΅°μ—μ„œ μ›ν•˜λŠ” μ—­λŸ‰μ— λŒ€ν•΄μ„œ μ§„μ§€ν•˜κ²Œ κ³ λ―Όν•΄ λ³Ό 수 μžˆμ—ˆλ˜ λœ»κΉŠμ€ μ‹œκ°„μ΄μ—ˆλ‹€.
  • Python, Pandas, sklearn λ“± Data Analytics의 κΈ°λ³Έ μ†Œμ–‘μΈ ν”„λ‘œκ·Έλž˜λ° 언어와 κΈ°λ³Έ νŒ¨ν‚€μ§€μ— λŒ€ν•œ κ³΅λΆ€λŠ” ν•„μˆ˜μ΄λ‹€.
  • 여기에 Kaggle Kernerl을 κ³΅λΆ€ν•˜λ©° λ‘œλ”, EDA, μ „μ²˜λ¦¬, λͺ¨λΈλ§, κ²°κ³Ό 해석 λ“±μ˜ μ—­λŸ‰μ„ ν•˜λ‚˜μ”© μŒ“μ•„κ°ˆ 것이닀.
  • 6μ›”, 7μ›”, 8μ›” - 2, 2, 2, 총 6개의 컀널을 λ°‘λ°”λ‹₯λΆ€ν„° μ œλŒ€λ‘œ κ³΅λΆ€ν•˜κ³  κ΅¬ν˜„ν•˜λŠ” 게 λͺ©ν‘œμ΄λ‹€.
  • λ‹€μŒ κΈ°νšŒμ— ν–‰μš΄μ„ 작기λ₯Ό λ°”λž€λ‹€.  

πŸ“Œ Check by myself

03. Study(연ꡬ)

  • 맀번 연ꡬλ₯Ό μ„€κ³„ν•˜κ³  μ‹€ν—˜μ„ ν•˜λŠ” κ³Όμ •μ—μ„œ λ§Žμ€ μž₯벽을 느꼈던 것 κ°™λ‹€. μ΄λ²ˆμ—λ„ λ§ˆμ°¬κ°€μ§€μ˜€λ‹€.
  • 달라진 점이라면 λͺ¨λΈλ§μ„ μœ„ν•œ 데이터 가곡을 μ΄λ²ˆμ— μ„±κ³΅ν–ˆλ‹€λŠ” 점이닀.
  • μ•žμœΌλ‘œ ν•  일은 κ·Έλ™μ•ˆ λ°°μ› λ˜ 아킀덱쳐듀을 λ°”νƒ•μœΌλ‘œ λ‚΄ 연ꡬ λͺ©ν‘œμ— λ§žλŠ” λͺ¨λΈλ§μ„ ν•˜λŠ” 것이닀.
  • μ‘°κΈˆμ”© λ‚˜μ•„μ§€κ³  μžˆλ‹€. 잘 될 거라 λ―ΏλŠ”λ‹€.

πŸ“Œ Check by myself

  • AE, VAE Base model 섀계 및 κ΅¬ν˜„
  • GAN λͺ¨λΈ λ°œμ „ 및 Training

 

올 ν•œ 해도 μ ˆλ°˜μ— λ‹€λ‹€λ₯΄κ³  μžˆλ‹€. 맀번 λŠλΌμ§€λ§Œ μ‹œκ°„μ€ 정말 λΉ λ₯΄κ²Œ ν˜λŸ¬κ°„λ‹€. 

 

ν˜λŸ¬κ°€λŠ” μ‹œκ°„ μ†μ—μ„œ λͺ©μ κ³Ό λ°©ν–₯을 μžƒμ—ˆλ˜ λ•Œλ„ 많고 λ‚΄κ²Œ 주어진 이 μ‹œκ°„μ„ λ†“μΉ˜μ§€ μ•ŠκΈ° μœ„ν•΄ μ—΄μ‹¬νžˆ λ…Έλ ₯ν–ˆλ˜ λ•Œλ„ λ§Žμ•˜λ˜ 것 κ°™λ‹€.

 

μ‚΄λ©΄μ„œ λŠλ‚€ 점은 λ‚΄κ°€ μ–΄λ–»κ²Œ ν•˜λ“  간에 μ‹œκ°„μ€ κ³„μ†ν•΄μ„œ 흐λ₯Έλ‹€λŠ” 점이닀. λ°©ν™©ν•˜κ³  μžˆμ–΄λ„ μ‹œκ°„μ€ 흐λ₯΄κ³ , μ—΄μ‹¬νžˆ 무언가λ₯Ό 해도 μ‹œκ°„μ€ 흐λ₯Έλ‹€λŠ” 것이닀.

 

λ‚΄κ°€ 무얼 ν•˜λ“ κ°„μ— ν˜λŸ¬κ°€λŠ” μ‹œκ°„μ„ 되돌리렀 λ…Έλ ₯ν•˜κ³  ν›„νšŒν•˜κΈ°λ³΄λ‹€λŠ” ν•œ λ‹¬μ΄λΌλŠ” μ‹œκ°„μ„ 작고 ν•œ 달 살이λ₯Ό ν•˜λŠ” 게 λ‚΄κ²ŒλŠ” μ΅œμ„ μΈ 것 κ°™λ‹€. 

 

ν•˜λ£¨ν•˜λ£¨ μ—΄μ‹¬νžˆ μ‚¬λŠ” 것은 쉽지 μ•Šλ‹€. 그런데 ν•œ 달이면 μ–˜κΈ°κ°€ 쑰금 달라진닀. 생각보닀 λ§Žμ€ μ„±μ·¨λ₯Ό 맛볼 수 있고 μ΄λŸ¬ν•œ μž‘μ€ 성취듀이 λ‚˜μ˜ μžμ‘΄κ°μ„ λ†’μ—¬μ€Œκ³Ό λ™μ‹œμ— 도전을 지속할 수 μžˆλŠ” νž˜μ„ μ£ΌλŠ” 것 κ°™λ‹€.

 

날이 많이 λ”μ›Œμ‘Œλ‹€. 6월도 μ—΄μ‹¬νžˆ μ‚΄μ•„λ³΄μž!

 

-20.06.13.Sat. pm12:45 책상에 앉아-

λŒ“κΈ€