Logo video2dn
  • Сохранить видео с ютуба
  • Категории
    • Музыка
    • Кино и Анимация
    • Автомобили
    • Животные
    • Спорт
    • Путешествия
    • Игры
    • Люди и Блоги
    • Юмор
    • Развлечения
    • Новости и Политика
    • Howto и Стиль
    • Diy своими руками
    • Образование
    • Наука и Технологии
    • Некоммерческие Организации
  • О сайте

Скачать или смотреть Categorical variable encoding

  • Soledad Galli | Data Scientist @ Train in Data
  • 2017-12-28
  • 2318
Categorical variable encoding
machine learningdata sciencefeature engineeringpython
  • ok logo

Скачать Categorical variable encoding бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно Categorical variable encoding или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

  • Информация по загрузке:

Cкачать музыку Categorical variable encoding бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео Categorical variable encoding

In this video, we implement different categorical encoding techniques, and we compare their effect on the performance of different machine learning algorithms.


Categorical variables are those that take strings, or categories as values, instead of numbers. For example, the variable color, with values red, blue and green is a categorical variable. If we use Scikit-learn to build machine learning models, we need to transform the strings of categorical variables into numbers. There are multiple techniques that we can use to do so.


In one hot encoding, we derive dummy variables from the categories of the variable, so that each category now becomes a variable with values 1 or 0 indicating if the category is present in each observation.



In ordinal or integer encoding, we replace the categories by integers. Usually first category seen in the variable get the value 0 and so on. A twist in this encoding is to assign the values based on the mean of the target per category. Thus, the category where the mean of the target is the smallest is replaced by 0, and that where the mean of the target is the higher, is replaced by n, n being the number of different categories.


In target encoding or mean encoding, we replace the category by the mean target value in that category.



Another technique used in finance is the weight of evidence, where the category is replaced by the natural logarithm of the percentage of positive instances divided the percentage of negative instances, positive and negative instances being the target equal to 1 or 0, respectively.


Different encoding techniques are orientated to improve the performance of different algorithms. For example, one hot encoding and the techniques that generate monotonic encoding tend to improve linear model performance, whereas for decision trees a random assignment of numbers to the categories may work just as well.


In this video, we compare the implementation of different technique using pandas. But keep in mind that this can be smoothed by using open source packages like Feature-engine or Scikit-learn as shown in these articles:


https://www.trainindata.com/post/feat...



https://www.trainindata.com/post/feat...

Комментарии

Информация по комментариям в разработке

Похожие видео

  • О нас
  • Контакты
  • Отказ от ответственности - Disclaimer
  • Условия использования сайта - TOS
  • Политика конфиденциальности

video2dn Copyright © 2023 - 2025

Контакты для правообладателей [email protected]