SciPy Korea 2023 - 머신러닝을 위한 정형 데이터 사이킷런 쓸까? 판다스 쓸까?

Описание к видео SciPy Korea 2023 - 머신러닝을 위한 정형 데이터 사이킷런 쓸까? 판다스 쓸까?

SciPy Korea 2023 - 머신러닝을 위한 정형 데이터 사이킷런 쓸까? 판다스 쓸까?

SciPy Korea 2023 에서 5월에 발표했던 내용입니다.
발표시간 제한으로 좀 더 하고 싶었던 이야기를 추가해서 다시 촬영하였습니다.
SciPy Korea 2023 에서 발표했던 영상은 링크에 남겨두겠습니다.

최근 트리, 부스팅계열의 알고리즘을 사용하면 전처리를 해주지 않아도 어느정도 좋은 성능을 냅니다.
하지만 트리계열 알고리즘을 사용하지 않으면 까다로운 전처리를 해야합니다.
전처리를 하다보면 데이터 누수 등의 실수도 하게 되는데 이런 실수를 방지하기 위해
판다스를 사용하면 좋을지 사이킷런을 사용하면 좋을지 얘기해 봅니다.
피처엔지니어링을 다양하게 처리한다 하더라도 scikit-learn의 column-transformer를 사용하면
코드의 양도 실수도 함께 줄여주게 됩니다.


SciPy Korea 2023 - https://scipy.kr/

6.1. Pipelines and composite estimators — scikit-learn column-transformer 문서
https://scikit-learn.org/stable/modul...




👉 페이스북 : https://www.fb.com/todaycode
👉 인스타그램 :   / _todaycode  


* 아래 URL과 쿠폰코드로 할인금액으로 수강하실 수 있습니다.
————————————————
모든 유료 강의 쿠폰코드 👉 https://bit.ly/inflearn-today-coupon-...
————————————————
🌱 인프런 📈 증권 데이터 수집과 분석으로 신호와 소음 찾기 🔎 전체 보기 👉 http://bit.ly/inflearn-finace-data ( 쿠폰코드: 3083-a12fb4ddd2d4 )
🌱 인프런 📊 공공데이터로 파이썬 데이터 분석 시작하기 💻 전체 보기 👉 https://bit.ly/inflearn-public-data-eda (쿠폰코드 : 3084-4e27fa1575a4 )
🌱 인프런 📝 단 두 장의 문서로 데이터 분석과 시각화 뽀개기⚡️ 전체 보기 👉 https://bit.ly/inflearn-pandas-tutorial (쿠폰코드 : 3085-6040d593c7e9 )
🌱 인프런 📚 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리 👉 https://bit.ly/inflearn-nlp-tutorial

Комментарии

Информация по комментариям в разработке