Svoboda | Graniru | BBC Russia | Golosameriki | Facebook

Разметим данные для обучения ML-моделей

Краудсорсинговая платформа Ozon Profit — это тысячи исполнителей для ваших задач в области машинного обучения и модерации контента. Они разметят данные любого типа и помогут быстро и бюджетно масштабировать ваш проект

30 000+
исполнителей
5+
лет опыта
300k+
задач в день

Гибкая и удобная платформа

Большая база исполнителей

Управляйте и отслеживайте их активность и производительность

Большая база исполнителей

Открытое API

Создавайте проекты самостоятельно, благодаря открытому API

Открытое API

Аналитика по проектам

Анализируйте и контролируйте качество выполнения заданий

Аналитика по проектам

Простой интерфейс

Создавайте задания по шаблону, без специальных знаний

Простой интерфейс

Автоматизация задач

Автоматизируйте типовые задачи и работу с проектами

Автоматизация
задач

Решения под ключ

Экономьте время и ресурсы для вашего бизнеса

Решения под ключ

Решения

Разметка данных

Фото и видео
  1. Классификация изображений и видео

  2. Сравнение вариантов

  3. Выделение частей объектов

  4. A/B тестирование

  5. Распознавание текста на фото и видео

Текст
  1. Анализ тональности отзывов на товары

  2. Определение темы и ключевых слов диалога

  3. Релевантность поиска товаров

  4. Транскрипция рукописных текстов

  5. Проверка орфографии и грамматики

Аудио
  1. Классификация аудио

  2. Запись и расшифровка речи

  3. Определение эмоций

  4. Идентификация событий

  5. Определение правильности ответов оператора

  6. Обогащение данных

Генерация контента
  1. Сбор оффлайн данных

  2. Обогащение данными из интернета

  3. Мониторинг цен

  4. Онлайн опросы

Модерация

Товары
  1. Определение товаров 18+

  2. Соответствие описания и фото

  3. Проверка качества изображений и видео

  4. Проверка сертификации товаров

  5. Проверка оригинальности бренда

Пользовательский контент
  1. Определение полезности ответов на вопросы

  2. Определение наличия персональных данных в отзывах

  3. Контент, запрещённый в РФ

Реклама
  1. Соответствие законодательству РФ

  2. Проверка качества изображений

  3. Символика или упоминание запрещённых соцсетей

А ещё у нас есть

Автоматизация

Упрощает работу с рутинными задачами и сокращает затраты на проект

Простое API

1 запрос на загрузку задач — 1 запрос на получение результата

Настройка

Перенесём и настроим проекты из других крауд систем, без потери качества

Скорость

Индивидуальный процесс распределения задач на исполнителей

Контроль

Прозрачный мониторинг задач, исполнителей и результатов

Гибкость

Открыты к доработкам и интеграциям

Не нашли свой вариант
или ищете решение под ключ?

Запустим проект с нуля до готового результата. Просто предоставьте данные и опишите задачу, а мы сделаем всё остальное

Кейсы

Сократили время в 3 раза на проверку машин курьеров Ozon fresh

Сократили время в 3 раза на проверку машин курьеров Ozon fresh

Проблема
С ростом бизнеса Ozon fresh стало сложно контролировать чистоту машин курьеров
Решение
Обучили ML-модель, автоматизировали процесс обработки за счёт распределения потока фотографий по категориям:  — чистота автомобиля  — брендинг  — соответствие госномера
Результат
Автоматизировали процесс и сократили время на проверку машин курьеров в 3 раза
Улучшили качество разметки данных поиска товаров до 97%

Улучшили качество разметки данных поиска товаров до 97%

Проблема
Улучшение поиска и ранжирования товаров требует значительных средств и не отвечает потребностям качества
Решение
Распределили проекты по товарным категориям и сформировали многоступенчатую связь проектов, включающую в себя различные этапы превалидации результатов, благодаря чему в работу исполнителям попадают только релевантные данные
Результат
Точность получаемых данных выросла до 97%, а затраты сократились на 50%
Обучили МL-модель закрывать более 90% запросов на модерацию

Обучили МL-модель закрывать более 90% запросов на модерацию

Проблема
Штатные исполнители не справляются с потоком данных и копится очередь заданий на модерацию товаров и отзывов
Решение
Настроили процесс модерации через краудсорс, с автоматизированным распределением данных по категориям и видам обработки
Результат
Сократили расходы на модерацию в 20 раз, повысили качество обработки товаров (менее 2% ошибок), избавились от очередей. На полученных данных обучили модель, которая теперь закрывает более 90% запросов на модерацию
Подготовили датасет для обучения и валидации speech-to-text ML-модели

Подготовили датасет для обучения и валидации speech-to-text ML-модели

Проблема
Для улучшения модерации и качества сервиса необходимо обучить ML-модель распознавать аудио контент
Решение
Разработали функционал для прослушивания и записи аудио файлов: исполнители надиктовывали определенные слова и словосочетания с различной скоростью и интонацией
Результат
ML-модель выявляет в аудио контенте триггерные слова и словосочетания. Модель можно использовать там, где необходима проверка аудио-контента: модерации, валидации качества работы рекрутеров, операторов call-центров и др.

Наша команда

Открытая

Оперативная поддержка и техническая помощь

Надёжная

Стабильная инфраструктура Ozon для больших нагрузок

С опытом

Создавали для себя и решаем задачи более 5 лет

Закажите демо

Подберём лучшее решение для вашего бизнеса и предоставим тестовый доступ