Что чаще всего ищут на авито статистика: «Авито» назвал самые продаваемые категории товаров за 2022 год

Содержание

Как посмотреть все объявления на карте Авито

Интернет-сервисы › Авито › Объявление › Как на Авито смотреть объявления на карте

Нажмите на «Показать объявления на карте». На новой карте появятся все объявления. Вы можете выбрать нужный вам район, приблизив карту колесиком мышки или же нажать на плюсик с правой стороны.

  • Нажимаем на «Показать объявления на карте», чтобы увидеть все объявления.
  • Можем выбрать нужный район, приблизив карту или нажав на плюсик.
  • Устанавливаем параметры поиска и нажимаем на «Найти».
  • Нажимаем на ссылку «Поиск объявлений на карте», чтобы увидеть объявления на карте.
  • Чтобы посмотреть скрытые объявления, нажимаем на скрытое меню.
  • Находимся на главной странице Авито и нажимаем на «Мои объявления».
  • Объявления, которые сейчас показываются на Авито, находятся в разделе «Активные».
  • В разделе «Архив» находятся объявления, которые уже были опубликованы, но не показываются.
  • Выбираем подраздел сайта для поиска объявлений.
  • Для увидения всех объявлений на сайте необходимо авторизоваться и выбрать «Мои объявления».
  • Для того, чтобы узнать, что чаще всего ищут на Авито, нужно провести соответствующий анализ.
  1. Как на Авито Поиск по карте
  2. Как открыть скрытые объявления на Авито
  3. Как посмотреть объявления Авито
  4. Как посмотреть объявления на Авито до публикации
  5. Как увидеть все объявления на Авито
  6. Как узнать что чаще всего ищут на Авито

Как на Авито Поиск по карте

Как искать объявления на карте:

1. Установите параметры поиска и нажмите на кнопку «Найти».
2. Над первым объявлением из результатов поиска вы увидите блок «Поиск объявлений на карте»:
3. Нажмите на ссылку «Поиск объявлений на карте», чтобы открыть карту, на которой будут отмечены объявления по указанным параметрам.

Как открыть скрытые объявления на Авито

Любое объявление можно скрыть нажав на крестик. Скрытое объявление можно посмотреть и вернуть, чтобы оно больше не было скрытым. Сделать это можно так: справа, у края окна есть скрытое меню обозначенное двумя горизонтальными стрелочками (смотрите первый скриншот).

Как посмотреть объявления Авито

На главной странице Авито нажимаете на кнопку «Мои объявления». После этого вы попадаете в раздел со всеми вашими объявлениями. Объявления, которые сейчас показываются на Авито и доступны пользователям находятся в «Активные». В разделе «Архив» находятся объявления ранее вами опубликованные, но которые не показываются.

Как посмотреть объявления на Авито до публикации

А) «Раздел AVITO, на котором искать объявления до опубликования» — выпадающий список позволяет выбрать необходимый подраздел сайта для поиска объявлений (в примерах, показанных на двух рисунках выше, выбранные подразделы — «Автомобили с пробегом» и «Телефоны»).

Как увидеть все объявления на Авито

Для начала необходимо авторизоваться на сайте, ничего сложного в этом нет, нужно всего лишь знать свои данные (логин и пароль). Далее плавным движением руки наводите курсор на свой логин(никнейм) на авито, и в выпадающем списке выбираете «Мои объявления», среди которых уже будет и статистика и всё, что вам нужно.

Как узнать что чаще всего ищут на Авито

Работает так: заходите в кабинет продавца, выбираете раздел «Аналитика спроса» и вкладку «Поисковые запросы». Вбиваете в строку название товара или любую фразу — и видите, как часто их ищут пользователи.

Что значит до 5 раз больше просмотров на Авито

Статьи › Авито › Как писать ключевые слова на Авито

До 2, 5 и 10 раз больше просмотров

Это давало дополнительные просмотры, но их количество было непредсказуемым. В новых услугах эффективность рассчитывают алгоритмы. Вы выбираете, во сколько раз хотите увеличить количество показов объявления покупателям, для которых оно релевантно, и как долго должна работать услуга.

  • Новые услуги на Авито позволяют увеличить количество просмотров объявления для релевантных покупателей до 5 или 10 раз.
  • Алгоритмы анализируют спрос, конкурентов и определяют, в каких блоках показывать объявления для повышения вероятности покупки.
  • Цифра с иконкой глаза на Авито указывает количество просмотров объявления за сегодня, цифра без скобок — общее количество просмотров.
  • В Авито Pro доступна информация по просмотрам, контактам и конверсии из просмотров в контакты.
  • Синие столбики на графике просмотров на Авито показывают базовые просмотры, зеленые — просмотры, принесенные услугами продвижения.
  • Стоимость уникального просмотра на Авито — от 80 копеек в зависимости от категории.
  • В разделе «Аналитика спроса» на Авито можно узнать, как часто пользователи ищут конкретный товар.
  • Для быстрой продажи на Авито нужно выбрать правильную категорию, продумать заголовок, установить адекватную цену, добавить информацию о товаре и красивые фото, верифицировать аккаунт и подумать о скидке.
  1. Что значит количество просмотров на Авито
  2. Как работает увеличение просмотров на Авито
  3. Как считаются просмотры Авито
  4. Что значит базовые просмотры на Авито
  5. Сколько стоит один просмотр на Авито
  6. Как узнать что чаще всего ищут на Авито
  7. Когда лучше поднимать просмотры на Авито
  8. Как на Авито продать быстрее
  9. Когда лучше продвигать на Авито
  10. Как работает оплата за просмотры на Авито
  11. Что значит тариф с оплатой за просмотры
  12. Что значит статистика в Авито
  13. Как правильно торговать на Авито
  14. Что такое счетчик продаж на Авито
  15. Когда лучше всего размещать объявления на Авито

Что значит количество просмотров на Авито

Количество просмотров снова указаны с иконкой глаза. Цифра, указанная в скобках — это просмотры за сегодняшний день. Цифра без скобок — это общее количество просмотров у данного объявления.

Как работает увеличение просмотров на Авито

Повышаем количество просмотров

А алгоритмы анализируют спрос, конкурентов и определяют, в каких блоках, в том числе в топе выдачи, показывать объявления и в какое время. Так объявление занимает высокие позиции в поиске Авито и получает больше просмотров, а значит, вероятность покупки повышается.

Как считаются просмотры Авито

В Авито Pro есть информация по четырём показателям. Просмотры и контакты — сколько людей посмотрели объявление, а сколько из них нажали кнопку «Показать телефон» или «Написать сообщение». Конверсия из просмотров в контакты — это количество запросов контактов, разделённое на количество просмотров.

Что значит базовые просмотры на Авито

На графике просмотров могут быть столбики двух цветов — синие и зелёные. Синие показывают базовые просмотры — их объявление получило бы без продвижения. А зелёные столбики — это просмотры, которые принесли услуги продвижения. Статистика объявления, к которому применили услуги продвижения.

Сколько стоит один просмотр на Авито

Оплата за уникальные просмотры

Стоимость просмотра — от 80 копеек в зависимости от категории.

Как узнать что чаще всего ищут на Авито

Как это работает

Работает так: заходите в кабинет продавца, выбираете раздел «Аналитика спроса» и вкладку «Поисковые запросы». Вбиваете в строку название товара или любую фразу — и видите, как часто их ищут пользователи.

Когда лучше поднимать просмотры на Авито

Если вероятность продажи высокая, выбирайте продвижение на один день, если низкая — на неделю. Конкуренция — количество и активность продавцов, который продают аналогичные товары. Если конкуренция высокая, подключайте услуги большей силы — до 5 или 10 раз больше просмотров.

Как на Авито продать быстрее

Директор по маркетингу вертикали «Авито Товары» Даниил Заболотный дал семь советов, которые помогут быстрее продать вещь:

  • Выберите правильную категорию
  • Продумайте заголовок
  • Установите адекватную цену
  • Добавьте необходимую информацию о товаре:
  • Красиво сфотографируйте товар
  • Верифицируйте аккаунт
  • Подумайте о скидке

Когда лучше продвигать на Авито

Услуги на один день хватит, если вам нужно продать единичный товар, а для большого объема — выбирайте продвижение на неделю. Разобраться, какое продвижение подходит вам, можно в подсказке Авито. Больше просмотров работает для всех категорий, но не во всех регионах.

Как работает оплата за просмотры на Авито

Как происходит оплата показов

Деньги списываются с баланса Авито каждый день раз в час. Если сумма достигает порога снятия, Авито уведомляет продавца и приостанавливает размещение объявлений, а после пополнения аванса — возобновляет показы и активирует объявления на 30 дней.

Что значит тариф с оплатой за просмотры

Как устроен тариф с оплатой за просмотры

Новый тариф позволяет оптимизировать расходы продавцов на продвижение и при этом получать от клиентов больше целевых действий — просмотров рекламы, звонков и откликов. Разместить предложения можно бесплатно, а деньги списываются за переходы покупателей в карточку объявления.

Аналитика спроса на Авито — это инструмент, позволяющий продавцам: анализировать активность посетителей сайта, которые ищут нужные товары по запросам; просматривать количество объявлений в статике и динамике; выбрать сферу деятельности на площадке и корректировать собственную стратегию продвижения на Авито.

Как правильно торговать на Авито

Как составить продающее объявление:

  • Выберите правильную категорию На Авито есть большое количество разделов: электроника, хобби и отдых, личные вещи и т.
  • Продумайте заголовок
  • Установите адекватную цену
  • Добавьте необходимую информацию о товаре:
  • Красиво сфотографируйте товар
  • Верифицируйте аккаунт
  • Подумайте о скидке

Что такое счетчик продаж на Авито

В профиле можно включить счетчик продаж для автоматического подсчета заработанных денег от успешных сделок. Эту «бухгалтерию» видит только владелец профиля. А вот автопродление платных услуг, наоборот, лучше отключить, чтобы лишний раз не списывались деньги.

Когда лучше всего размещать объявления на Авито

Всё зависит от типа товара или услуги. Как правило, оптимальное время для публикации объявлений в некоторых нишах — 8-10 часов утра, днем и 18-20 часов вечера. В это время большая часть пользователей не работают и проводят время в телефоне.

Краткий обзор конкурса Kaggle для Авито

У меня не было много времени на этот конкурс, поэтому я не вкладывал много средств в разработку функций, создание ансамблей или другие вещи. Поскольку я также участвовал в конкурсе Avazu, в котором использовался теперь уже известный код tinrtgu, я решил использовать тот же подход и здесь.

Общая цель конкурса — проанализировать поведение пользователей, чтобы создать модель рекомендации рекламы для показа пользователям, при этом показатель успеха определяется тем, нажимает ли пользователь на рекламу или нет. На эту тему уже много работы, поэтому нет необходимости пересобирать все с нуля.

Если вы не читали статью от Google о FTRL для предсказания рекламы и их просмотра из окопов , то я действительно могу порекомендовать это в качестве первого шага. Они касаются всех тем, которые мы находим в приложениях, таких как разреженность, ограничения на аппаратное обеспечение, ограничения на время обработки и так далее.

Для тех, кто также разрабатывал системы торгов в реальном времени для платформ со стороны спроса или платформ со стороны предложения или других систем прогнозирования рекламы, это, вероятно, будет очень знакомо.

Данные, предоставленные Avito для конкурса, состояли из последовательности просмотров, включая информацию о пользователе, просмотренную им рекламу, любые возможные запросы на связь с продавцом и так далее. Размер данных не представляет особых проблем, если вы используете онлайн-методы, как я, поскольку основной файл данных с поисковой информацией занимает около 10 ГБ без сжатия и содержит около 400 миллионов записей. Если вы хотите подробнее изучить способы ускорения процесса обучения, ознакомьтесь с Sublinear Optimization for Machine Learning by Clarkson et. др.

Реализация прошла довольно быстро, так как решение известно, для которого уже существует код Python. Как это часто бывает, Абишек опубликовал решение, которое превзошло бенчмарк. Для запуска этого решения потребовалось некоторое время, так как оно зависит от NumPy и Pandas, что исключает мое обычное использование PyPy для кода Python, требующего немного большей производительности. Это легко обойти с помощью некоторой развязки, поэтому я разделил части, зависящие от NumPy и Pandas, в отдельный файл, что позволило использовать PyPy для кода с высокой производительностью, а другой код запускать отдельно.

Основной код, который может выполняться PyPy, состоит из определения объекта ftrl в дополнение к нескольким методам подбора, прогнозирования и обновления. Ничего сумасшедшего.

Если вы хотите собрать тестовый набор для локального сравнения, следующий метод, по-видимому, очень хорошо коррелирует с результатами в общедоступной таблице лидеров.

Из конкурса авито:

  1. Возьмем минимальную дату, которая встречается в тестовом наборе (12 мая?).

  2. Возьмите все ПОСЛЕДНИЕ сеансы для каждого пользователя, которые произошли после этой даты (или попробуйте). Последняя сессия — это сессия с самой высокой датой для каждого пользователя.

Эта проблема имеет временную составляющую, поэтому выборка из других периодов времени не годится, так как предполагается, что реклама со временем меняется. Случайная выборка не подойдет, так как она получит большую долю пользователей, у которых много сеансов. Если мы возьмем от пользователя что-либо, кроме последних (или n последних) сеансов, мы оставим будущее пользователя в тренировочном наборе, поэтому cv не будет совпадать из-за переобучения. Итог: на странице данных говорится, что они берут последний сеанс для каждого пользователя, который происходит после 12 мая. Так что нам просто нужно сделать то же самое (как можно ближе)!

Андрей Остапец, занявший 9-е место в конкурсе, на подходе сказал следующее:

Моя единственная модель ftrl с базовыми функциями: AdID, UserID, IPID, Position, Price, … + второго и третьего порядка взаимодействие между некоторыми из этих функций + оценка сходства между SearchQuery и Title и SearchParams и Params. Он получает оценку Public LB ниже 0,044.

Добавление в эту модель только одной новой функции PositionFactor от моего товарища по команде Александра. Это дало невероятные приращения, и модель набрала ~ 0,0418 на Public LB.

PositionFactor = hash( [Position 1_place:ObjectType 2_place:ObjectType 6_place:ObjectType 7_place:ObjectType 8_place:ObjectType]) , где Position — позиция данного контекстного объявления на странице результатов поиска. k_place:ObjectType — позиция и тип других объявлений на странице результатов поиска (при наличии данных о них).

Модели Александра vw+xgb и vw+rf дают ему ~ 0,0424 на Public LB

После настройки гиперпараметров и нахождения весов для линейной комбинации наших решений мы получили 0,04137 на Public LB.

Gilberto Titericz Junior занял 5-е место и использовал этот метод, как описано Дмитрием Ефимовым:

Я использовал что-то подобное в конкурсе Avazu, если вам интересно, вы можете проверить мою презентацию (ссылка больше не доступна) about решение (есть несколько слайдов о Batch FTRL). Принцип заключается в сортировке комбинированного набора данных (обучения и тестирования) по некоторым полям и применении алгоритма FTRL.

Тогда это будет работать следующим образом: алгоритм обучается на первой партии из набора поездов и делает прогноз на первой партии из набора тестов. Затем он начинает обучение на второй партии из набора поездов, начиная с коэффициентов из первой партии и так далее.

Это был интересный и веселый конкурс, а также хороший полигон для новых идей и подходов. Я написал реализацию на Go, которую я могу упаковать в виде библиотеки и в какой-то момент выложить на GitHub. А пока, вот разветвленная суть от ceshine реализации из другого конкурса:

Обнаружение дублирующих объявлений Avito, Интервью победителей: 3-е место, Команда ADAD | Марио, Джерард, Келе, Правин и Жилберто | от команды Kaggle | Блог Kaggle

Опубликовано в

·

9 минут чтения

·

27 июля 2016 г.

Соревнование Avito по обнаружению дубликатов рекламы проводилось на Kaggle с мая по июль 2016 года и привлекло 548 команд с 626 игроками. В этом задании Kagglers просеивал рекламные объявления, чтобы определить, какие пары объявлений были дубликатами, предназначенными для того, чтобы раздражать подающих надежды покупателей. В этом конкурсе, на который было подано более 8000 заявок, были предложены уникальные стратегии, учитывая сочетание текстовых данных на русском языке и 10 миллионов изображений. В этом интервью команда ADAD описывает свой выигрышный подход, основанный на разработке функций, включая набор показателей сходства, применяемых как к изображениям, так и к тексту.

Марио Филью : Мой опыт машинного обучения полностью «самоучка». Я нашел множество образовательных материалов, доступных в Интернете через МООК, академические статьи и лекции в целом. С февраля 2014 года я работаю консультантом по машинному обучению в проектах небольших стартапов и компаний из списка Fortune 500.

Gerard Toonstra : Я работал научным разработчиком в Thales в течение 3 лет, что познакомило меня с более научными методами и алгоритмами разработки. Большая часть конкретных знаний по машинному обучению была получена на курсах на Coursera, а также на соревнованиях Kaggle и на форумах.

Келе Сюй : Я аспирант по теме «Интерфейс для бесшумной речи».

Правин Адепу : В академическом плане у меня есть степень бакалавра технологий, и я работаю техническим архитектором/консультантом полного цикла BI.

Gilberto Titericz : У меня высшее образование в области электронной инженерии и степень магистра. в зоне беспроводной связи. В 2011 году я начал самостоятельно изучать науку о данных, а после присоединения к Kaggle я начал узнавать еще больше.

Марио Филью : Я услышал о Kaggle, когда проходил свои первые курсы по науке о данных, и после того, как я узнал о нем больше, я решил попробовать себя в некоторых конкурсах.

Gerard Toonstra : Некоторое время назад я активно участвовал в розыгрыше главного приза Netflix, и в конце концов он указал на сайт Kaggle как на еще один потенциальный источник запачканных рук. Я игнорировал это до июля прошлого года, когда решил начать челлендж Avito. Довольно круто, что ровно год спустя, после некоторого энергичного кагглинга, я являюсь частью заявки на 3-е место.

Келе Сюй : Я участвовал в Кубке KDD 2015 и занял там 40-е место. Это были мои первые соревнования. После KDD Cup 2015 я стал Kaggler, что помогло мне многому научиться за последний год.

Правин Адепу : Я новичок в машинном обучении, R и Python. Мне нравится учиться на практике, и я понял, что Kaggle лучше всего подходит для моего обучения, участвуя в конкурсах. Первоначально я экспериментировал с несколькими соревнованиями, чтобы найти модели обучения, и начал серьезно работать с последних 6 месяцев, и я многому научился за последние 6 месяцев и с нетерпением жду возможности узнать больше от Kaggle.

Gilberto Titericz : После Google AI Challenge 2011 я искал в Интернете другую платформу для онлайн-конкурсов и нашел Kaggle.

Mario Filho : В то время это было единственное соревнование, которое имело разумный размер набора данных и не слишком фокусировалось на изображениях. Поэтому я подумал, что можно будет получить хороший результат с помощью разработки функций и обычных инструментов.

Gerard Toonstra : Я чувствую, что мой опыт разработки программного обеспечения может дать мне преимущество в определенных соревнованиях. Огромный объем данных требует некоторого планирования и модуляции кода. Я начал делать это в конкурсе Dato, продолжил делать это немного лучше для Home Depot, а в Avito я начал более серьезную конвейерную обработку и разработку функций. Дело не в том, что конвейеры сложные, единственная цель — сократить время создания функций. Вместо того, чтобы ждать завершения одного сценария за 8 часов, я просто создаю функции по частям и склеиваю/объединяю их вместе.

Келе Сюй : Когда я решу пойти на новое соревнование, я хотел бы выбрать тему, в которой у меня раньше не было опыта. В таком случае я возьму больше у конкурентов. На самом деле до этого конкурса у меня было несколько экспериментов на темы НЛП. Это главная причина, по которой я принял участие в этом конкурсе.

Praveen Adepu :

  1. Мне нравится проектирование признаков, это завершение требует много ручной разработки признаков
  2. Очень высокий балл LB очень привлек меня, чтобы проверить свои навыки обучения на предыдущих соревнованиях.
    Я ушел с большим количеством идей по разработке функций даже после того, как прошел тест через пару недель, поэтому планировал поработать немного больше времени над этим соревнованием.

Gilberto Titericz : В последнее время меня интересуют соревнования по обработке изображений и глубокому обучению.

Mario Filho : Я выделил и очистил текстовые поля, затем использовал tf-idf для вычисления сходства между ними. Использовали скрипт сходства хешей, доступный на форумах, для вычисления сходства между изображениями. После создания и тестирования множества функций я использовал XGBoost для обучения модели.

Gerard Toonstra : У меня был один набор функций для текстовых функций, что, по сути, почти то же, что и другие на форуме. Затем я создал еще один набор функций с дополнительными текстовыми функциями, функцией подобия minhash, tf-idf+svd поверх описания, а затем я поработал с хэшами изображений: ahash,phash,dhash с функциями min, max, avg и количеством нолей, разделенных по максимальному количеству изображений. Я продолжал фокусироваться на нормированных показателях расстояния, поэтому разделите их на «длину», где это уместно, или на количество изображений. По мере развития событий я также делал гистограммы изображений в RGB, гистограммы в HSV и расстояние между изображениями Earth Mover.

В итоге я использовал только четыре типа моделей: логистическая регрессия с функциями tf-idf с очищенным текстом, XGB, Random Forests и FTRL.

Келе Сюй : Здесь я использую только XGBoost. XGBoost здесь действительно конкурентоспособен. Моя лучшая одиночная модель XGBoost может попасть в топ-14 как в публичной, так и в частной таблице лидеров.

Praveen Adepu : Никаких специальных методов предварительной обработки, а просто следовали всем передовым методам разработки функций и заботились о времени обработки при создании новых функций.
Используется — XGBoost, случайный лес h3o, глубокое обучение h3o, дополнительные деревья и регуляризованный жадный лес.

Gilberto Titericz : Большая часть предварительной обработки была выполнена в текстовых функциях, таких как удаление стоп-слов и выделение корней. Также я создаю очень интересную функцию, используя глубокое обучение. Для этого я использовал предварительно обученную модель MXNet Inception 21k, чтобы предсказать один класс для каждого из 10 миллионов изображений в наборе данных. Измерение некоторой статистики между этими классами помогло улучшить наши модели.

Используемые контролируемые методы обучения основаны на повышении градиента (XGBoost), RandomForest, ExtraTrees, FTRL, линейной регрессии, Keras и MXNet. Мы также использовали алгоритмы libffm и RGF, но в итоге от них отказались.

Mario Filho : Я изучил новые методы вычисления схожести изображений на основе хэшей и 2-3 русских слов.

Gerard Toonstra : Преимущество работы в команде и извлечения уроков из этого опыта. Я очень хотел узнать о стекировании. На mlwave.com есть хорошее описание, но когда вы начинаете делать это на практике, все равно возникают вопросы. Другое наблюдение заключается в том, что по мере того, как соревнование подходит к концу, все руки на кону, и вы должны приложить последние усилия, особенно на прошлой неделе. У меня не хватало аппаратных ресурсов, и я использовал в самом крайнем случае три 16-процессорных машины, разбросанных по трем географическим зонам в Google Cloud. Несмотря на аппаратные проблемы и исследования, которые нам пришлось провести, я заметил некоторых соло-конкурентов, которые смогли быстро завоевать позиции и взлететь. Я действительно уважаю это. Это говорит мне о том, что эти ребята приобрели такой большой опыт, что они постоянно принимают правильные решения о том, на что тратить время, и мне еще предстоит пройти долгий путь.

Келе Сюй : Я многому научился у наших товарищей по команде, особенно по оптимизации гиперпараметров для модели XGBooost и методам ансамбля. Кроме того, я узнал, как выполнять некоторые задачи НЛП.

Правин Адепу : Я думаю, что присоединиться к команде в нужное время и с правильными членами команды — лучшее решение, которое я принял в этом соревновании.

Присоединившись к команде, я поставил перед собой две цели:

  1. Учиться у команды, внося свой вклад в меру своих знаний
  2. Обучение сборке/укладке

Пользуясь случаем, хочу поблагодарить всю мою команду Хильберто, Марио, Жерара и Келе.

Gilberto — спасибо за обучение многим концепциям, включая стекирование
Mario — спасибо за руководство во время экспериментов со многими моделями
Gerard — никогда не забывайте наше первоначальное обсуждение разработки функций
Kele — спасибо за приглашение присоединиться к команде это случилось

Я многому научился у этой команды за один месяц, чем в одиночку за последние 6 месяцев, и с нетерпением жду возможности поработать с ними в ближайшем будущем.

Gilberto Titericz : Я многое узнал о метриках расстояния между текстом и изображением.

Mario Filho : если вы планируете применять машинное обучение, постарайтесь понять основы моделей, такие понятия, как проверка, предвзятость и дисперсия. По-настоящему поймите эти концепции и попытайтесь применить их к данным.

Gerard Toonstra : Первое, что нужно сделать, это понять результат перекрестной проверки и его конкретное отношение к таблице лидеров в этом соревновании, а также как установить надежную стратегию фолда в целом. После этого я рекомендую создать очень простую модель, основанную на функциях, которые не переобучают и оценивают поведение. Затем добавьте пару функций одну за другой, которые вряд ли будут переопределены, и продолжайте оценивать. Запишите разницу между CV и LB при подаче заявок. По мере того, как вы будете доверять своему местному резюме, начните прорабатывать дополнительные функции и проведите пару промежуточных проверок, чтобы убедиться, что вы не переоснащаетесь на местном уровне; особенно в зависимости от того, как построены некоторые функции агрегации, они могут иметь эффект переобучения.

Приступая к работе, не позволяйте себе увязнуть в бесконечных часах параметризации и гиперпараметризации моделей. Вы можете получить дополнительные +0,00050, чтобы подпрыгнуть на 3 позиции, но это не то, что делает большинство на LB. Выясните, как создавать новые информативные функции, каких функций следует избегать, и когда вы устанете от этого, только , а затем потратите некоторое время на оптимизацию того, что у вас есть.

Келе Сюй : На самом деле, я думаю, что Kaggle — неплохая платформа как для специалистов по данным, так и для тех, кто только начинает, поскольку Kaggle может предоставить платформу для новичков, чтобы проверить, как работает каждый алгоритм.

Что касается технических предложений, я бы сказал, что прочное местное резюме является ключевым моментом для победы в соревновании. Обычно я трачу 2–4 недели на проверку своего местного резюме.

Разработка функций важнее, чем оптимизация гиперпараметров.

Хотя XGBoost достаточно, чтобы получить относительно хороший рейтинг в некоторых соревнованиях, мы также должны протестировать модели режима, чтобы добавить разнообразие моделей, а не просто выбрать другое начальное число или установить другую максимальную глубину для древовидных методов.

И последнее: просто проверьте свои идеи, и вы можете получить обратную связь от LB. Когда вы добьетесь более высокого ранга в одном соревновании, у вас появится мотивация сделать его лучше.

Правин Адепу : Думаю, я называю это своим опытом, а не советом:

  1. Начните с четких целей, медленно и постепенно учитесь основам и быстро учитесь продвинутым концепциям и заканчивайте мастерством
  2. Никогда не бойтесь запуск и сбой
  3. Четкое понимание локального CV, недообучения и переобучения
  4. Начать обучение с разработки признаков и завершить стекированием

Gilberto Titericz : Прочитано много связанного материала. Поиск проблем для решения. Читайте о решениях проблем. И заставьте пальцы работать, программируйте и учитесь на своих ошибках.

Марио Филью — консультант по машинному обучению, помогающий компаниям по всему миру использовать машинное обучение, чтобы максимизировать ценность, которую они получают от данных для достижения своих бизнес-целей. Кроме того, он наставляет людей, которые хотят научиться применять алгоритмы машинного обучения к наборам данных реального мира.

Жерар Тунстра получил диплом морского офицера и инженера, но в основном работал инженером-программистом и основал собственную компанию в Бразилии, работающую с дронами для съемки. Сейчас он работает скрам-мастером в отделе бизнес-аналитики Coolblue в Нидерландах.

Келе Сюй является аспирантом и пишет докторскую диссертацию в Институте Ланжевена (Университет Пьера и Марии Кюри). Его основные интересы включают: распознавание тихой речи, машинное обучение и компьютерное зрение.

Правин Адепу в настоящее время работает техническим архитектором / консультантом по бизнес-аналитике в компании Fred IT, базирующейся в Мельбурне, и занимается машинным обучением и архитектурой данных.

Gilberto Titericz — инженер-электронщик со степенью магистра. в телекоммуникациях.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *