как работает и чем помогает бизнесу — Маркетинг на vc.ru
1198 просмотров
На Авито бизнес может продавать товары, даже не имея сайта. Но получать доход и при этом обходиться без статистики невозможно. Чтобы компании, которые работают на площадке, могли развиваться, был создан инструмент «Аналитика спроса». Разбираемся, как он работает, какую пользу приносит бизнесменам и какие альтернативы существуют.
Что может «Аналитика спроса»
«Аналитика спроса» – инструмент Авито для бизнеса. Он позволяет узнать, сколько сообщений и звонков получили объявления на площадке. Сначала сервис был доступен только в категории «Товары» (кроме аксессуаров и запчастей для авто), но позже появился и в «Недвижимости». Авито планирует развивать инструмент и предоставить доступ к аналитике и в других категориях. В сервисе показывается статистика по таким параметрам:
- количеству продавцов в этой категории;
- просмотрам объявлений в выбранной тематике;
- количеству контактов.
На контактах в Авито остановимся подробнее. Они представляют собой просмотры номеров телефонов и сообщений в чате. Учитываются уникальные пользователи. Если один и тот же человек и запрашивал номер, и писал в чате, действия будут засчитаны как один контакт.
Особенности работы инструмента
- Информация собирается ежедневно. Статистику можно посмотреть в динамике на графиках в интерфейсе. Доступны отчеты за месяц и год.
- Данные по категориям отображаются в формате таблицы. Пользователь может сравнивать показатели по смежным тематикам.
Как бизнес получает доступ к «Аналитике спроса»
Сервис для аналитики спроса невозможно купить отдельно. Также Авито не планирует пока продавать его как отдельную услугу. Доступ к аналитике зависит от категории.
- «Недвижимость». Тут оплата взимается только за размещение объявлений. Сервис «Аналитика спроса» доступен в тарифах «Расширенный» и «Максимальный».
- «Товары». Использовать «Аналитику спроса» можно бесплатно, если подключить тарифы «Максимальный» или «Расширенный» при оплате за просмотры.
Узнать больше о продвижении можно в статье «Как запустить рекламу бизнеса на Авито».
Как «Аналитика спроса» приносит пользу бизнесу
Сервис позволяет узнать, сколько конкурентов работает в вашей категории, насколько часто пользователи открывают объявления, пишут в чат или запрашивают номер.
Помогает оценить возможности. Инструмент показывает, какое количество целевых действий получают объявления в категории. Это средние показатели по регионам. Они позволяют спрогнозировать, сколько контактов и просмотров удастся получить в перспективе. Важно, что статистика учитывает, какая часть открытий объявления превратится в дальнейшем в контакты.
Этот показатель на Авито напоминает CTR. Узнать о нем больше можно в статье «Что такое CTR и как он влияет на успех рекламной кампании».
Определяет спрос и предложение в нужной категории. «Аналитика» показывает объем объявлений, число просмотров, насколько часто в тематике приходят контакты. По мнению экспертов, нужно смотреть не только на количество объявлений, опубликованных в вашей сфере. Важно еще и число продавцов. Чем их больше, тем выше конкуренция. Может потребоваться более внимательно подойти к поисковой оптимизации текстов и подключить дополнительные услуги, чтобы стать более заметным для потенциальных покупателей.
Оценивает число потенциальных клиентов.
Так как инструмент знает количество контактов и объявлений в тематике, он может предсказывать уровень спроса. Чем выше значение, тем популярнее категория или товар на Авито, а значит, лучше перспективы для бизнеса.По мнению Авито, число контактов больше 1 – это хорошо. Но в по-настоящему популярной категории показатель будет выше.
Пример
В апреле 2022 года в категории «Игровые приставки» на Авито было 16 049 объявлений по Санкт-Петербургу. Количество сообщений в чат и открытий составило 64 934. Получается, что в среднем на одно объявление приходилось 4,05 контактов. Эта же цифра представлена в графе «Уровень спроса». За год объявлений стало немного больше, но количество контактов сильно увеличилось, то есть спрос повысился. Это означает, что ниша перспективная. Она привлекательна для новых продавцов.
Как использовать инструмент «Аналитика спроса»
После подключения тарифа сервис с аналитикой будет доступен в личном кабинете. Он появится под графой «Статистика». Как только вы кликните по нему, то сразу перейдете на страницу с основным блоком данных. Даже этот экран поможет первично оценить конкуренцию. Заметили, что в нише подается около 1 700 000 объявлений ежемесячно? Она 100% высококонкурентная.
Фильтры для статистики. Всю представленную информацию можно отсортировать. Это позволит получить необходимые для анализа данные. Сразу под заголовком расположены фильтры:
- «Категории» – примерное разделение из каталога Авито, где товары рассортированы по общим признакам. Например, можно выбрать «Бытовая техника», «Ноутбуки», «Электроника» и т. д. Вы можете выбрать пункт из списка или самостоятельно указать название в поиске;
- «Регион» – можно задать любую часть России, где вы планируете вести бизнес или уже его ведете;
- «Период» – отрезок времени, который вас интересует. Например, сутки или месяц.
Каждая категория дробится на подкатегории. Например, вы выбрали «Электронику», в которую входят «Аудио и видео», «Игры, приставки и программы». Если выберете «Аудио и видео», то увидите в ней более мелкие группы: «Наушники и микрофоны», «Усилители и ресиверы». Можно использовать дополнительные фильтры:
- «Поиск в категории» – позволяет задать название интересующего товара. Например, «Наушники AirPods» или «Гарнитура»;
- «Цена» – помогает сильно сузить статистику, чтобы изучить уровень спроса в определенном ценовом сегменте. Не обязателен к заполнению.
Показатели в аналитике. После фильтрации вам будут данные для анализа и уже рассчитанный спрос.
Для расчета уровня спроса применяется формула: количество контактов / на объем объявлений в конкретной тематике. Показатель отражает число открываний телефона (сначала он не показывается), сообщений, которые в среднем имеет одно объявление. Авито помогает продавцам и добавляет оценку спроса: высокая, средняя или низкая.
«Аналитика спроса» помогает легко понять, насколько популярна у покупателей та или иная товарная группа. Оценка «низкий спрос» показывает, что нужно серьезно задуматься, стоит ли вкладываться в нишу. Это наиболее актуально для тех, кто собирается находить новые точки роста или расширять ассортимент товаров (например, раньше предлагали только комплектующие для ПК, а сейчас в продаже появятся и ноутбуки). На графиках можно увидеть, как меняется категория с течением времени. Например, насколько сильно повышается спрос в сезон, востребованы ли товары из конкретной категории именно сейчас (трендовая ли ниша), возможен ли подъем или спад в перспективе.
Показатели интереса пользователей:
- «Просмотров на объявление» – среднее количество просмотров одного объявления;
- «Всего просмотров» – общее число просмотров всех объявлений в нише.
Эти значения можно рассматривать, когда вы предлагаете товары с длительным циклом принятия решения. Например, пользователи могут тратить много времени на выбор ювелирного украшения или дорогого ноутбука. Когда из статистики видно, что люди интересуются товаром, но при этом спрос низкий, можно попробовать поддержать размещенные объявления медийной рекламой и подарками, скидками. Возможно, резко увеличить продажи в выбранной нише поможет платное продвижение.
Показатель для выявления перспектив:
Эта информация указывает, есть ли у ниши потенциал для продаж, сколько лидов приходит. Показатель позволяет сделать вывод, на каком этапе эффективнее всего использовать каналы платного продвижения.
Показатели для оценки конкуренции:
- «Всего продавцов…» – сколько компаний и людей сейчас работают в конкретной тематике;
- «Объявления» – сколько предложений сейчас представлено в конкретной нише на Авито.
Если цифры большие, то конкуренция высокая. В таком случае первый тест в выбранной тематике может оказаться очень затратным с точки зрения проработки коммерческого предложения и платного продвижения.
Показатель для оценки трендовости ниши:
- «Доля от всех объявлений в категории…» – какая часть рынка в выбранной категории занята интересующими вас товарами.
Эта статистика помогает понять, является ли продукт аутсайдером на рынке или находится в тренде.
Ключевые слова. Это аналог сервиса Яндекс Вордстат для использования внутри Авито. Во вкладке «Поисковые запросы» можно проверить спрос на ключевые фразы, чтобы понять, как часто их вводят на площадке. Она отличается от вкладки «Спрос в категориях» тем, что вы не ограничиваетесь рамками своей ниши: можно анализировать спрос во всех категориях Авито.
В разделе доступны следующие фильтры:
- «Запрос» – поле для ввода интересующих ключевых слов или словосочетаний (например, «iPhone 13 Pro 128 gb»). После добавления запроса показывается график, на котором видно, как изменялся спрос в течение заданного периода времени;
- «Временной промежуток» – доступны периоды в 30 или 7 дней;
- «Регион» – откуда пришел запрос. Нужно указать город, где у вас уже есть бизнес или планируется расширение;
- «Сравнение» – можно задать сразу несколько запросов и сравнить спрос;
- «Категории» – к какому разделу каталога относится запрос.
Вкладка «Поисковые запросы» помогает не только оценивать уровень конкуренции в своей нише, но и прописывать правильные заголовки у объявлений. Можно сравнить несколько вариантов (например, «сноубордические варежки», «варежки для сноуборда») и выбрать тот, который чаще вводят пользователи. Так можно получить больше переходов и, вероятно, контактов.
Как пользоваться полученными данными
Инструмент «Аналитика спроса» помогает выдвигать и подтверждать гипотезы. Например, «bluetooth-наушники – трендовый продукт» или «открывать интернет-магазин, в котором продаются товары с высоким спросом, выгоднее в городе-миллионнике». Разберем варианты, как можно использовать данные из «Аналитики спроса».
Добавление новинок в ассортимент. Вы можете узнать, на какие товары растет спрос прямо сейчас, и добавить их в каталог. Например, магазин на Авито предлагает наушники и хочет продавать колонки. Инструмент позволяет предпринимателю узнать, какие модели наиболее популярны, а какие не пользуются спросом.
Изучение спроса при открытии филиала в регионе. С помощью инструмента можно оценить спрос в выбранной нише в различных регионах страны. Так бизнес может определить наиболее перспективные направления для расширения географии продаж.
Поиск ниши по спросу. Запуская бизнес, до покупки товара нужно изучить ситуацию на рынке и определить, в какой категории лучше развиваться. В этом помогает аналитика ниш на Авито.
Прогноз сезонного спроса. По динамике, отраженной на графике, можно понять, как изменяется спрос в течение года и влияет ли на него день недели или сезон.
Прочие способы анализа спроса
Если вы пока не планируете покупать бизнес-тариф на Авито, можно использовать другие варианты для аналитики спроса.
Количество объявлений
Вы можете узнать количество объявлений по товару, который предлагаете, если введете его название в строку поиска. Важно задать регион, в котором вы предлагаете товары. Цифра представлена на скриншоте.
Официальные исследования
У Авито есть блог, который помогает бизнесу. В разделе «Аналитика» можно узнать инсайты и актуальные данные по разным категориям. Например, там можно узнать, какие подержанные автомобили готовы приобретать пользователи, сколько процентов россиян получили доп. образование за полгода и пр. Блог помогает объяснить резкое увеличение или падение продаж, найти точки роста.
Аналитика через Вордстат
До появления вкладки «Поисковые запросы» в Авито единственным вариантом узнать спрос был Вордстат. У него простой принцип поиска: нужно ввести интересующий запрос и добавить к нему слово «авито». Если вы работаете не по всей территории России, необходимо указать ваш регион.
Полученная статистика не будет точной, так как Вордстат отображает информацию исключительно по запросам в поиске Яндекса. Но он помогает понять, какие товары чаще всего ищут люди, какие запросы нужно добавить в объявления.
Авито старается поддерживать продавцов и создает инструменты для их развития. «Аналитика спроса» позволяет лучше узнать потребителей и хорошо спланировать свою работу.
Если вы профессионально ведете контекстную и таргетированную рекламу и в том числе рекламу через Авито, регистрируйтесь в сервисе click.ru, присоединяетесь к партнерской программе и возвращайте проценты от расходов клиентов на рекламу.
Как посмотреть статистику на Авито | Как пользоваться Аналитикой спроса на Avito
Аудиоверсия этой статьи
Авито — одна из самых популярных площадок для развития бизнеса. Максим Оганов, основатель агентства интернет-маркетинга Oganov Digital и эксперт в бизнес-школе Авито, рассказывает, чем может быть полезен инструмент Аналитика спроса предпринимателю и как им пользоваться
Деловая среда
Платформа знаний и сервисов для бизнеса
Открыть ИП сейчас
Максим Оганов
– Руководитель агентства комплексного интернет-маркетинга «Oganov Digital»
– Сертифицированный авитолог
– Спикер на мепроприятиях от Деловая среда, Авито, Like Центр, eLama, Синергия и МинЭкономРазвития
– Эксперт и преподаватель в официальной бизнес-школе «Авито»
– Участник акселлераторов ФРИИ и СтартХаб
– Практикующий маркетолог с опытом более 8 лет.
Содержание
Возможности аналитики спроса и как ей пользоваться
Как анализировать статические данные
Как анализировать динамические данные
Чем аналитика спроса полезна бизнесу
💎 Деловая среда Премиум
Вступайте в закрытый клуб и получите доступ к материалам по развитию бизнеса
Попробовать бесплатно на 14 дней
Аналитика спроса на Авито — это инструмент, позволяющий продавцам:
анализировать активность посетителей сайта, которые ищут нужные товары по запросам;
просматривать количество объявлений в статике и динамике;
выбрать сферу деятельности на площадке и корректировать собственную стратегию продвижения на Авито.
Аналитика спроса помогает определиться с тарифом и понять, какие услуги по продвижению потребуются вашему бизнесу, ведь с высокой конкуренцией нужны услуги большей силы.
Инструмент будет полезен как начинающим предпринимателям, так и опытным продавцам. Любой пользователь Авито с тарифами «Расширенный» и «Максимальный» может посмотреть статистику спроса на товары отдельных категорий.
Возможности аналитики спроса и как ей пользоваться
Рассмотрим работу инструмента на примере категории «Электроника». Чтобы перейти к инструменту, зайдите в свой аккаунт Авито, перейдите в личный кабинет, нажав на иконку профиля.
После перехода в профиль вы увидите меню в левой части экрана. Найдите пункт «Аналитика спроса».
Теперь перед вами страница инструмента.
Все объявления можно сортировать по трем параметрам: регион, категория товара и период публикации (за месяц или за день). Статистика отображается по категориям и подкатегориям. Так, «Электроника» — это категория, объединяющая подкатегории: телефоны, аудио и видео, ноутбуки, товары для компьютера и др. Таким образом, мы можем видеть статистику категории «Электроника» в целом, а также статистику отдельных подкатегорий.
Рассмотрим работу инструмента на реальном примере. У предпринимателя Константина собственный магазин электроники, и он хочет использовать площадку Авито в качестве инструмента продаж:
проанализировать спрос;
выбрать тариф продвижения;
товары, которые стоит продвигать.
Для анализа спроса укажем регион Санкт-Петербург, категорию «Электроника», период — месяц. Получим следующую картину.
💎 Деловая среда Премиум
Вступайте в закрытый клуб и получите доступ к материалам по развитию бизнеса
Попробовать бесплатно на 14 дней
Как анализировать статические показатели
На снимке представлены численные показатели по данным: продавцы, объявления, просмотры, контакты и уровень спроса.
Продавцы — это физические и юридические лица, которые разместили хотя бы одно объявление в категории. Уровень конкуренции напрямую зависит от количества продавцов. Если конкуренция слишком высокая (ориентировочно — свыше 50 тыс. продавцов), потребуется платное продвижение или услуги авитолога, специалиста по продвижению на Авито.
Объявления — общее число объявлений на Авито в настоящий момент.
Контакты — количество заинтересованных пользователей — таких, которые написали или нажали кнопку «Показать номер».
Просмотры — количество посещений карточки.
Уровень спроса — отражает среднее количество покупателей на одно объявление в категории. Уровень спроса 3–5 считается высоким и говорит о популярности категории.
Наибольший интерес для аналитики представляют: количество объявлений, количество контактов и уровень спроса.
Количество объявлений — это общее число объявлений в указанной категории по заданным фильтрам. Этот показатель отражает общий уровень спроса и заполненности рынка теми или иными товарами. В примере видим, что общее число товаров в категории «Телефоны» — 165 392, а в категории «Аудио и видео» — 182 030.
📌 Совет
При анализе стоит учесть, что одно объявление может содержать в себе продажу сразу нескольких товаров. К видеокамере может продаваться чехол, штатив и другие аксессуары за дополнительную плату или комплект видеокамер либо аудиотехники. Но бывает и обратное, когда один товар появляется в нескольких объявлениях. Такое можно наблюдать на примере продажи квартир.
Второе интересующее нас поле — контакты. Контакт отражается в статистике, когда потенциальный покупатель нажал кнопку «Показать номер» или начал диалог с продавцом. При этом, даже если пользователь совершил несколько действий, он считается одним контактом. Видим, что в категории «Телефоны» — 579 467 контактов, а в категории «Аудио и видео» — 279 541.
Следующий важный показатель — уровень спроса. Это отношение количества контактов к количеству объявлений в категории. Заметим, что в обеих рассматриваемых категориях он отличается: в среднем на каждое объявление в категории «Телефоны» приходится 3 контакта, а в категории «Аудио и видео» — 1.
Здесь стоит обратить внимание на то, что уровень спроса — это результат простого деления. Поясним: в категории могут быть заброшенные или некачественные объявления с завышенными ценами, а также очень привлекательные предложения, которые закрываются за считанные часы. Поэтому делать однозначные выводы относительно уровня спроса не стоит, но при оценке популярности категории этот показатель очень поможет.
Мы рассмотрели статические показатели данных. Этот вид данных позволяет оценить уровень спроса в категории за конкретный период — месяц или день. Особенно важными пунктами при анализе являются количество контактов, объявлений и уровень спроса.
На основе приведенных данных Константину рациональнее создавать объявления в категории «Телефоны», поскольку спрос здесь более высокий и обеспечит больший поток клиентов. Но чтобы составить полную картину, стоит обратиться и к динамическим показателям.
Как анализировать динамические показатели
Нажав на название категории «Телефоны», можно посмотреть подробную статистику в цифрах и аналитику спроса на графике, как на изображении ниже.
По графику становится ясно — уровень спроса на телефоны был на среднем уровне на протяжении 2021 года и начал повышаться в феврале 2022-го, достигнув пиковых значений в марте. Сейчас спрос возвращается к своему прежнему состоянию.
Перейдем в категорию «Аудио и видео».
Здесь видим, что уровень спроса в разы ниже, где пиковое значение — 1,93. Однако динамика прослеживается похожая: резкий скачок уровня спроса в марте и затем его стабилизация к прежним значениям.
В этом примере Константину стоит ориентироваться на статические показатели, поскольку динамические не показывают четкой картины. Вероятнее всего, пиковое значение спроса в марте в обеих категориях связано с внешними временными факторами.
📌 Совет
Уровень спроса в динамике может быть полезен в случае сравнения двух разных направлений, например «Средства гигиены» и «Ноутбуки». Но случается и так, что динамика отличается в категориях одного направления, поэтому анализ в любом случае необходим.
Среди рассмотренных категорий наиболее перспективной для размещения объявлений будет категория «Телефоны». Хотя в категории «Аудио и видео» больше объявлений, количество контактов здесь значительно ниже, что и определяет более низкий уровень спроса. Среднее число контактов в категории «Телефоны» — 3 человека на объявление. Это говорит о том, что посетители заинтересованы в этом виде товаров, то есть чаще ищут их по запросам, следовательно, шансы на успешные продажи повышаются.
🚀 Сервис для быстрого старта бизнеса
Зарегистрируйте ИП или ООО без визита в налоговую и пошлины — через сервис от Деловой среды
Подать заявку онлайн
Чем аналитика спроса полезна бизнесу
Аналитика спроса — это удобный, а главное, полезный инструмент при работе с площадкой Авито.
С помощью аналитики спроса можно увидеть:
какие товары сезонные,
на какие растет спрос,
какие постепенно уходят с рынка.
Сезонные товары отслеживаются по динамическим данным — кривая спроса будет повышаться в определенный сезон. Рост спроса сопровождается повышением кривой ближе к настоящей дате, а спад — снижением кривой.
Аналитика позволит выбрать нужную категорию товара, если вы только планируете начать свой бизнес на Авито, а также оценить уровень конкуренции в своей категории и составить грамотную стратегию продвижения на Авито — определить количество объявлений и их структуру, выбрать услуги по продвижению.
Статьи
10 советов предпринимателям, как успешно продавать на маркетплейсах
Выбор ниши
Статьи
Как привлекать клиентов через маркетплейсы услуг
Соцсети
Статьи
5 ошибок предпринимателей на сервисах объявлений.
Гид по эффективным продажамПродвижение в Интернете
Авито Прогноз спроса. СОДЕРЖАНИЕ | by Furqan Sayed
СОДЕРЖАНИЕ
- ОБЗОР ПРОБЛЕМЫ.
- ИСТОЧНИК НАБОРА ДАННЫХ И ОПИСАНИЕ.
- ИСПОЛЬЗУЕМЫЕ ПОКАЗАТЕЛИ.
- ИССЛЕДОВАТЕЛЬСКИЕ СТАТЬИ/РЕШЕНИЯ/АРХИТЕКТУРЫ/ЯДРА.
- ПЕРВЫЙ ПОДХОД
- EDA.
- МОДЕЛИРОВАНИЕ И РЕЗУЛЬТАТЫ.
- ДЕМОНСТРАЦИЯ ПРИЛОЖЕНИЯ.
- БУДУЩАЯ РАБОТА.
- ИСХОДНЫЙ КОД ПРОЕКТА.
- ССЫЛКИ.
ОБЗОР ПРОБЛЕМЫ
1. В электронной коммерции сочетание мельчайших нюансов продукта может создать огромную разницу в повышении интереса пользователя к покупке продукта или услуги.
2. Упомянутые ниже детали могут иметь большое значение для развития интереса, если пользователь хорошо ознакомился с продуктом.
3. В приведенных выше примерах показано, как продавец может оптимизировать списки товаров на веб-сайте электронной коммерции.
4. Но что произойдет, даже если продавец полностью оптимизировал листинг своего продукта и не произвел никакого количества продаж. Это приводит к проблеме анализа спроса на товар, который продавец хочет продать.
5. Это очень важно, потому что, если продавец вкладывает свои деньги в рекламу, а люди не посещают его товар или даже после посещения не заинтересованы в покупке желаемого им товара, это ясно объясняет, что есть какая-то проблема в продукт продавца.
6. Гиганты электронной коммерции, такие как Amazon, Flipkart, Myntra, Walmart, Ebay, Rakuten и AliExpress тратят миллионы долларов на рекламу, и если спрос на товары отсутствует, это приводит к огромным потерям для компании или даже продавец, который тратит кучу собственных денег на рекламу своего продукта.
7. Если его требования к продукту не существуют, простое разочарование продавца может привести к большим проблемам в бизнесе.
8. В апреле 2018 года Avito, российский гигант электронной коммерции, открыл конкурс в kaggle, основанный на предсказании спроса на тот или иной товар.
9. Avito — российский сайт объявлений с разделами, посвященными продаже товаров общего назначения, работе, недвижимости, знакомствам, продаже автомобилей и услугам. Avito — самый популярный сайт объявлений в России и второй по величине сайт объявлений в мире после Craigslist.
10. Набор данных, предоставленный для этого тематического исследования, был создан самой командой Avito и имеет различные категориальные характеристики, такие как идентификатор рекламы, заголовок рекламы, описание рекламы, рекламное изображение, item_id, user_id и т. д. с возможностью сделки в качестве целевой переменной.
11. Здесь вероятность сделки — это непрерывная переменная, которая принимает значения от 0 до 1. Нули указывают наименьшую вероятность того, что предмет будет куплен, а 1 — наибольшую вероятность того, что предмет будет куплен. Итак, эта проблема — проблема регрессии в машинном обучении.
ИСТОЧНИК НАБОРА ДАННЫХ И ОПИСАНИЕ
Источник набора данных: https://www. kaggle.com/competitions/avito-demand-prediction/data
Для этой постановки задачи мы используем «train.csv», «test .csv» и заархивированные данные обучающих и тестовых изображений для прогнозирования вероятности сделки по рекламе «AVITO».
- train.csv — Данные поезда.
- ‘item_id’ — идентификатор объявления.
- ‘user_id’ — идентификатор пользователя.
- «регион» — регион объявления.
- «город» — город объявления.
- ‘parent_category_name’ — Категория объявлений верхнего уровня согласно рекламной модели Avito.
- ‘category_name’ — Мелкозернистая категория объявлений согласно рекламной модели Авито.
- ‘param_1’ — Необязательный параметр из рекламной модели Авито.
- ‘param_2’ — Необязательный параметр из рекламной модели Авито.
- ‘param_3’ — Необязательный параметр из рекламной модели Авито.
- ‘title’ — Заголовок объявления.
- «описание» — описание объявления.
- «цена» — Цена объявления.
- ‘item_seq_number’ — Порядковый номер объявления для пользователя.
- ‘activation_data’ — Дата размещения объявления.
- ‘user_type’ — Тип пользователя.
- «изображение» — идентификационный код изображения. Привязывается к jpg-файлу в train_jpg. Не каждое объявление имеет изображение.
- ‘image_top_1’ — Классификационный код изображения на Авито.
- ‘вероятность_сделки’ — Целевая переменная . Это вероятность того, что реклама действительно что-то продала. Невозможно точно проверить каждую транзакцию, поэтому значение этого столбца может быть любым числом с плавающей запятой от нуля до единицы.
- test.csv — Тестовые данные. Та же схема, что и для данных поезда, за исключением того, что для этого набора данных отсутствует «вероятность сделки». Нам нужно это предсказать.
- train_jpg_[от 0 до 4].zip — zip-файлов, содержащих изображения объявлений с данными о поездах. Размер около 50гб.
- test_jpg.zip — zip-файлов, содержащих изображения объявлений с тестовыми данными. Размер около 20гб.
ИСПОЛЬЗУЕМЫЕ ПОКАЗАТЕЛИ
В текущей постановке задачи, Учитывая числовые, категориальные, изображения данного продукта, Предскажите значение вероятности спроса на этот продукт. Это проблема регрессии, в которой нам нужно уменьшить среднеквадратичную ошибку (RMSE).
RESEARCH-PAPERS/SOLUTIONS/ARCHITECTURES/KERNELS
1. Approach No 1: Machine Learning Algorithm
- CatBoost Algorithm has been used for approach
- It is developed by Yandex
- Documentation Ссылка: https://catboost.ai/en/
- URL ядра решения Kaggle : https://www.kaggle.com/code/julichitai/avito-eda-catboost
Catboost — это библиотека машинного обучения с открытым исходным кодом и алгоритм, который использует повышение градиента на деревьях решений . Список всех категориальных функций должен быть передан в параметре cat_features, а кодирование остальных данных, моделирование будет выполняться Catboost. Он превосходит алгоритм повышения градиента. Он также использует GPU, предоставляя параметры task_type. Этот алгоритм можно протестировать на наборе данных Avito, чтобы найти производительность, а также производительность может быть подтверждена соответствующим образом.
2. Подход № 2: с использованием нейронных сетей ( алгоритм глубокого обучения ).
Author : Shubham Chouksey
- URL of Neural Network Approach:
https://medium.com/swlh/simple-neural-network-from-scratch-30b175eb1e6
Neural Networks , иногда их называют искусственными нейронными сетями (ИНС) , они представляют собой подмножество машинного обучения и ядро алгоритмов глубокого обучения. Их название и структура вдохновлены человеческим мозгом, имитируя то, как биологические нейроны передают сигналы друг другу. Это означает, что алогиртм пытается имитировать поведение человеческого мозга.
Искусственные нейронные сети (ИНС) состоят из слоев узлов, содержащих входной слой, один или несколько скрытых слоев и выходной слой. Каждый узел или искусственный нейрон соединяется с другим и имеет соответствующий вес и порог. Если выход любого отдельного узла превышает указанное пороговое значение, этот узел активируется, отправляя данные на следующий уровень сети. В противном случае данные не передаются на следующий уровень сети.
3. Подход № 3: Использование Word Embeddings и RNN (рекуррентные нейронные сети)
- В следующем ядре Kaggle Word Embeddings и RNN используются для прямого прогнозирования Deal_Probability.
- Вложения являются обучающей частью тренировочного процесса.
- Мы даже можем использовать векторы предварительной подготовки FastText на русском языке для достижения лучших результатов.
- Предварительно обученный FastText: https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.ru.300.bin.gz
URL-адрес ядра решения Kaggle:
https://www.kaggle.com/code/nivgeron/text2score-keras-rnn-word-embedding-a64fd0
4. Подход № 4: Использование размытия Обнаружение с помощью OpenCV
Автор: Muhammed Furkan Gülşen
Для выявления размытости изображения используются OpenCV и оператор Лапласа.
Чтобы найти размытость изображения, выполняются следующие шаги:
- Найти быстрое преобразование Фурье изображения.
- Запишите распределение высоких и низких частот.
- При небольшом количестве высоких частот эти изображения помечаются как размытые изображения.
Но если использовать этот подход, то частота различается для разных типов объектов. Для одного объекта значение «низкое количество высокой частоты» будет другим для других объектов. Одним из таких решений является разновидность метода Лапласа. Печ-Пачеко и др. в их статье ICPR 2000 г. Выполните следующие шаги, чтобы получить решение:
а. Рассмотрим один канал изображения.
б. Сверните его в ядро 3 * 3.
в. Рассчитать дисперсию.
д. Если дисперсия падает ниже порога, то она считается размытой.
Все вышеперечисленные шаги можно выполнить в OpenCV с помощью одной строки кода.
Реализация приведена ниже:
cv2.Laplacian(image, cv2.CV_64F).var()
Итак, основная идея здесь состоит в том, чтобы включить коэффициент размытости изображений АДС как одну из характеристик определить спрос на рекламу.
ПОДХОД ПЕРВОГО РАЗРЕШЕНИЯ
Проблема может быть решена с помощью следующего подхода:
1. Выполните EDA для раскрытия, чтобы проверить, как распределяются все без исключения функции или они следуют определенному шаблону, найдите недостающие значения в набор данных и, если возможно, приписать эти отсутствующие значения
2. Выполнить проектирование признаков, извлекая дополнительные признаки из наших заданных признаков и рассматривая их как входные данные для прогноза.
3. Выполните разбиение с проверкой поезда и закодируйте все числовые и категориальные признаки.
4. Выполните обучение на всех возможных моделях глубоких нейронных сетей и выберите модель, которая дает нам наилучшие значения производительности.
EDA
- На первом этапе строится диаграмма Венна для проверки уникальных и общих значений функций, которые присутствуют как в поезде, так и в тестовых данных.
- Приведенный выше снимок представляет собой диаграмму Венна как для обучения, так и для тестовых данных функции идентификатора пользователя как для поезда, так и для тестовых данных.
- На приведенном ниже рисунке показана диаграмма Венна для характеристик городов на основе данных поездов и испытаний.
- Ниже приведена диаграмма Венна с описанием функций обучения и тестовых данных.
- Теперь мы также построили столбчатую диаграмму, показывающую, какие функции имеют уникальные значения, присутствующие в данных поезда
- Используя ту же методологию, мы также можем построить ее для тестовых данных.
- Мы также построили графики вероятности для числовой цены объявления и целевой переменной вероятности сделки. См. снимки ниже.
Гистограмма вероятности сделки
График вероятности сделки
- Поскольку в данных присутствуют более высокие значения цены рекламы, мы применили преобразование журнала для функции цены рекламы.
Гистограмма цены объявления после преобразования лога
График вероятности сделки Вероятность сделки после преобразования лога
- Поскольку Avito является российским гигантом электронной коммерции, значения, присутствующие в некоторых функциях, представлены на русском языке.
- Для этого мы использовали две переводящие библиотеки API.
1. Googletrans от Google
2. Переводчик от Microsoft
- Ниже приведен снимок топ-10 известных регионов для рекламы Avito
- Снимок топ-10 известных городов для рекламы avito 00006
- Аналогичным образом, топ-10 известных значений можно найти для любого другого категориального признака.
- Ниже представлена круговая диаграмма, показывающая распределение рекламы по региону 9.0006
- Круговая диаграмма, показывающая распределение рекламы на основе названия родительской категории
- Гистограмма для пользователей, давших рекламу В зависимости от региона
- Гистограмма для пользователей, давших рекламу На основе родительских категорий объявлений 7
- Мы также выполнили EDA для данных, основанных на времени.
- Распределение Avito Ads по неделям
- Распределение Avito Ads по дням недели
- Распределение Avito Ads по дням месяца
- Создание WordCloud
- Для заголовка
- Для описания
- Точно так же мы можем выполнить WordCloud для других текстовых функций, таких как город, регионы, параметр ad2 1.
ПОСТРОЕНИЕ МОДЕЛИ И ВЫВОДЫ
- Прежде всего, набор данных csv загружается как фрейм данных pandas.
- Объекты, присутствующие в наборе данных поезда, имеют следующие отсутствующие значения, как показано на снимке ниже:
- Как показано на снимке, параметры объявления 1, 2 и 3 имеют отсутствующие значения. Функция цены имеет отсутствующие значения. Некоторые изображения и их классификационный код отсутствуют, потому что в некоторых объявлениях нет изображений во время рекламы. Кроме того, некоторые описания пользователей отсутствуют.
- Чтобы заменить отсутствующие значения, см. ниже суть.
- Для цены мы вводим среднее значение цены в соответствии с категорией объявления.
- Для кода классификации отсутствующие значения вменяются как -1, что указывает на отсутствие кода классификации для этого изображения.
- Для текстовых функций, таких как описание, параметры объявления и, возможно, заголовок, если в нем есть какие-либо отсутствующие значения, значения вменяются как «нулевой» текст.
- Мы также выполняем разработку функций, извлекая некоторые дополнительные функции из заданных функций.
1. Дата активации
2. Описание
3. Название
4. Параметры объявления
5. Цена
к приведенным ниже сниппетам для функций сейчас, после и после
2 включение функций, время выполнения построения модели.1. ANN без признаков изображения.
- В этой модели построена простая ИНС (без извлечения данных изображения и включения их в качестве признаков).
- Прежде всего, давайте предварительно обработаем набор данных, чтобы он заработал.
- Для категориальных функций применяется LabelEncoder, а для числовых функций выполняется MinMaxScaler.
- После предварительной обработки построена модель нейронной сети. Обратитесь к приведенному ниже снимку для архитектуры.
- В этом случае используются два входа. Один вход имеет категориальные признаки в качестве входных данных, а другой — числовые признаки в качестве входных данных.
- Мы взяли функцию потерь как MSE (среднеквадратичная ошибка), а взятые метрики — это пользовательское RMSE (среднеквадратичная ошибка).
- После обучения модели с настройкой гиперпараметров и обратными вызовами мы получаем Loss и Metric модели как:
2. ANN с функциями изображения.
- В этой модели построена ИНС (на этот раз с учетом особенностей изображения).
- Мы рассматриваем значение размытия изображения, среднее значение красного, синего и зеленого. Для отсутствующих значений изображения мы вменяем отсутствующие значения как -1. Обратитесь к приведенным ниже фрагментам.
- Предварительно обработайте набор данных, чтобы он заработал.
- Для категориальных функций применяется LabelEncoder, а для числовых функций выполняется MinMaxScaler.
- После предварительной обработки построена модель нейронной сети. Обратитесь к приведенному ниже снимку для архитектуры.
- После обучения модели с настройкой гиперпараметров и обратными вызовами мы получаем потери и метрики модели как:
3. ИНС с функциями изображения с встраиванием ГРУ.
- В этой модели построена простая ИНС (на этот раз с учетом характеристик изображения) также с использованием встраивания ГРУ.
- Предварительно обработайте набор данных, чтобы он работал.
- Для предварительной обработки текстовых функций мы удаляем символы, стоп-слова, теги html и lxml, после чего выполняется лемматизация.
- После лемматизации предложения выполняется однократное представление, и последовательность дополняется одинаковой длиной для каждого предложения (для заголовка max_length=7 и для описания max_length=250).
- Для категориальных функций применяется LabelEncoder, а для числовых функций выполняется MinMaxScaler.
- После предварительной обработки построена модель нейронной сети. Обратитесь к приведенному ниже снимку для архитектуры.
- После обучения модели с настройкой гиперпараметров и обратными вызовами мы получаем Loss и Metric модели как:
4. ANN с функциями изображения с внедрением LSTM.
- В этой модели построена простая ИНС (на этот раз с учетом особенностей изображения) также с использованием встраивания LSTM..
- Предварительно обработайте набор данных, чтобы он заработал.
- Для предварительной обработки текстовых функций мы удаляем символы, стоп-слова, теги html и lxml, после чего выполняется лемматизация.
- После лемматизации предложения выполняется однократное представление, и последовательность дополняется одинаковой длиной для каждого предложения (для заголовка max_length=7 и для описания max_length=250).
- Для категориальных функций применяется LabelEncoder, а для числовых функций выполняется MinMaxScaler.
- После предварительной обработки построена модель нейронной сети. Обратитесь к приведенному ниже снимку для архитектуры.
- После окончательных наблюдений и выводов можно обнаружить, что это наша самая эффективная модель
- Исходный код этой модели приведен во фрагменте ниже. Мы получаем Loss и Metric модели как:
Final Observations:
После обучения всех моделей мы получаем наилучшие потери и показатели, как показано на снимке ниже. такие типы, как tanh, elu и т. д. и нет. агрегатов ГРУ и ЛСТМ.
ИСХОДНЫЙ КОД ПРОЕКТА
Вы можете получить доступ к полному исходному коду по адресу:
Вы не можете выполнить это действие в данный момент. Вы вошли в другую вкладку или окно. Вы вышли из системы на другой вкладке или…
github.com
Мой профиль Linkedin также указан ниже
https://www.linkedin.com/in/sayyed-furqan-hussain-bsci-it-6b31071a6
ССЫЛКИ:
- Команда прикладного ИИ и ее наставники.
- https://www.analyticsvidhya.com/blog/2021/06/lstm-for-text-classification/
- https://www. kaggle.com/code/shivamb/ideas-for-image-features- и качество изображения. Для извлечения данных изображения этот блокнот kaggle часто упоминается для этого самостоятельного тематического исследования.
- https://www.geeksforgeeks.org/artificial-neural-network-in-tensorflow/
- https://www.kaggle.com/code/dhznsdl/nn-model-adding-variables-step-by- шаг
Категории | Мостафа Эль-Араби
Проекты
Конкурс Kaggle по прогнозированию спроса Avito
Соревнования, Проекты ·Проверьте код github
Avito запустила конкурс на Kaggle, предлагая пользователям предсказать Avito, чтобы предсказать спрос на интернет-рекламу на основе ее полного описания (название, описание, изображения и т. д.), ее контекста (географическое место размещения, уже размещенные похожие объявления) и исторический спрос на подобную рекламу в. ..
Многоязычная платформа Bot Framework V4
Проекты ·Проверьте код github
Во время моей работы в Microsoft Research Lab в Каире мне посчастливилось работать над проектом фреймворка бота для поддержки нескольких языков.
Обучение распознаванию речи с помощью речевых команд Tf
Соревнования, Проекты ·Проверьте код github
В конце 2017 года Google запустила конкурс на Kaggle, используя свою команду Speech для набора данных. В этом соревновании перед нами стояла задача предсказать простые команды по вводимой пользователем голосовой команде. Каждое высказывание длится около 2 секунд.
Этот конкурс привлек меня, чтобы получить больше опыта…
Библиотека создания моделей
Проекты ·Проверьте код github
Во время моей работы в Valeo из-за важного запроса на проект я смог получить больше опыта как в MATLAB (ранее использовавшемся в предыдущем проекте компьютерного зрения), так и в моделях Simulink.
Классификация действий по неподвижным изображениям
Проекты ·В качестве заключительного проекта курса компьютерного зрения в моем колледже с профессором Марваном Торки мы использовали классификацию действий Pascal Voc 2010. Этот проект побудил меня узнать больше о машинном обучении и компьютерном зрении в частности. С тех пор как этот проект машинное обучение стало для меня хобби, а платформа Kaggle облегчила мне жизнь в изучении новых техник…
Разработка Windows Phone
Проекты ·На втором курсе Александрийского университета меня привлекла область разработки мобильных приложений. В то время я обнаружил, что Microsoft Windows Phone 7.1 SDK подходит для начала мобильной разработки на C# на новой многообещающей мобильной платформе.
Веб-сайт Allemny Initiative
Проекты ·Allemny — это арабское слово, которое означает «научи меня». Эта инициатива в основном направлена на поощрение самообучения и обновление методов обучения с использованием новых тактик обучения, чтобы справиться с современными технологиями. Мы создаем короткие видеоролики, которые простым способом объясняют инженерные темы и программное обеспечение, чтобы каждый мог понять наши данные.
В этом проекте…
Соревнования
Конкурс Kaggle по прогнозированию спроса Avito
Соревнования, Проекты ·Проверьте код github
Avito запустила конкурс на Kaggle, предлагая пользователям предсказать Avito, чтобы предсказать спрос на интернет-рекламу на основе ее полного описания (название, описание, изображения и т. д.), ее контекста (географическое место размещения, уже размещенные похожие объявления) и исторический спрос на подобную рекламу в…
AI Challenger англо-китайский машинный перевод
Соревнования ·Ai Challenger, новая китайская платформа для задач ИИ, их первый конкурс был связан с системой машинного перевода, и я хотел попробовать свои методы в системах NMT в системе, в которой я понятия не имею о целевом китайском языке.
В этом конкурсе я участвовал как Марб и получил 25,50 блю баллов за их тест Тестовый набор…
Обучение распознаванию речи с помощью речевых команд Tf
Соревнования, Проекты ·Проверьте код github
В конце 2017 года Google запустила конкурс на Kaggle, используя свою команду Speech для набора данных. В этом соревновании перед нами стояла задача предсказать простые команды по вводимой пользователем голосовой команде. Каждое высказывание длится около 2 секунд.
Этот конкурс привлек меня, чтобы получить больше опыта…
Система бронирования зданий
Соревнования ·Летом 2013 года инженерный факультет Александрийского университета объявил конкурс на создание системы онлайн-бронирования номеров с автоматическим заполнением номеров на основе имеющихся курсов, а также их вместимости и необходимого оборудования в помещении, я выиграл первый приз этого конкурса и мой система развернута по адресу http://eng. staff.alexu.edu.eg/~m.elaraby/
Участие в ACM Sigmod 2013 EGN Team
Соревнования ·ACM Sigmod Programming Contest — это соревнование по программированию, запущенное в 2013 году, в основном направленное на реализацию программы, используемой для сопоставления больших документов, проиндексированных инструментом во время выполнения.
Это был мой первый всемирный онлайн-соревнование, и это был захватывающий опыт для меня и моих коллег из команды EGN.
Опыт
Работа в Раисе
Опыт ·Мне удалось получить предложение от Raisa Egypt, стартапа, специализирующегося на прогнозировании нефти и газа по геологическим особенностям суши.
Работа в Microsoft Research Lab
Опыт ·Я всегда хотел работать в области машинного обучения, и во время работы в Valeo я участвовал в kaggle в учебных целях. Переход в Microsoft Lab помог мне получить больше промышленного и исследовательского опыта в этой области.
Работа в Valeo
Опыт ·После окончания инженерного факультета Александрийского университета мне посчастливилось получить рекомендацию в компании Valeo Automotive, за 2 года и 3 месяца в Valeo я приобрел обширные знания в области разработки программного обеспечения.
Стажировка в Бкаме в качестве инженера-программиста
Опыт ·Bkam был быстрорастущим стартапом, специализирующимся на онлайн-сравнении цен на товары, доступные онлайн и на месте, в нескольких магазинах и предоставлении вам ссылки на магазин с лучшей ценой на конкретный товар.
На втором курсе мне посчастливилось получить рекомендацию от моего ассистента Ахмеда ЭльШаркаси присоединиться к ним.
Публикации
Идентификация критических нейронов в архитектурах ИНС с использованием смешанного целочисленного программирования
Публикации ·Скачать статью
Проверить код
В этом исследовании мы пытаемся понять архитектуру нейронной модели, вычисляя показатель важности для нейронов. Вычисленный показатель важности можно использовать для сокращения модели или для понимания того, какие функции более значимы для обученной ИНС (искусственной нейронной сети). Рейтинг важности…
Перевод разговорной речи с учетом гендерных аспектов с арабского на английский
Публикации ·Скачать статью
Во время моей работы в Microsoft Research Lab в Каире мы проводили мозговой штурм для исследовательских проектов, связанных с нашей работой Skype Translator для предстоящей летней стажировки. Мне пришла в голову идея создать систему машинного перевода, которая сохраняет потерянную гендерную информацию при переводе с арабского Английский.
Синтетические разговорные данные для нейронного машинного перевода
Публикации ·Скачать статью
Во время моей работы в Microsoft Research Lab в Каире моей первой задачей было преобразовать левантийский арабский диалект в английскую систему NMT, но параллельных данных, доступных для диалектического левантийского языка, было недостаточно для обучения приличной модели для переводчика Skype.
Учебники
Введение в смешанное целочисленное программирование
Учебники ·Смешанно-целочисленное программирование используется для решения задач оптимизации с дискретными переменными решения. Следовательно, его допустимая область представляет собой набор несвязанных целочисленных точек, и алгоритмы, основанные на градиенте, не могут быть применены напрямую.
Обучение модели Attentional LSTM
Учебники ·
Обзор бумаги
Прогнозирование точности нейронной сети по весам
Обзор статьи ·Проверьте код github
В этой статье Unterthiner et al. (2020) эмпирически показали, что мы можем предсказать разрыв в обобщении нейронной сети, только взглянув на ее веса. В этой работе они выпустили набор данных из 120 тысяч сверточных нейронных сетей, обученных на разных наборах данных.
…
Прогнозирование разрыва обобщения в глубоких сетях с распределением маржи
Обзор статьи ·Проверьте код github
В этой статье (Jiang et al. (2018)) они обсуждают метод, который может предсказать разрыв в обобщении на основе обученных глубоких нейронных сетей. Авторы использовали информацию о предельном распределении из входного обучающего набора в качестве вектора признаков, используемого оценщиком для получения…
Объяснение добавления нескольких задач PackNet в единую сеть путем итеративного сокращения
Обзор статьи ·Проверьте код github
В этой статье (Mallya & Lazebnik, 2018) они обсуждают метод добавления и поддержки нескольких задач в одной архитектуре, не беспокоясь о катастрофическом забывании. В этой статье они показывают, что три задачи мелкозернистой классификации могут быть добавлены к одной…
Стабилизация обучения GAN с помощью случайных проекций
Обзор статьи ·Проверьте код github
В этой статье (Neyshabur et al. (2017)) они представили структуру для стабилизации обучения GAN с использованием нескольких проекций с фиксированными фильтрами каждого входного изображения на другой дискриминатор. Обучение моделей GAN нестабильно в многомерном пространстве и некоторые проблемы, которые могут.