Данные создают настоящий ИИ
25 февраля в Москве прошла конференция "Качество данных 2021", посвященная эффективному использованию данных в бизнесе.

В рамках мероприятия специалисты из ведущих компаний, сферы финансов, госуправления и IT поделились своими стратегиями, инструментами и опытом работы с данными и искусственным интеллектом. Анна Серебряникова, управляющий партнер nlogic, президент Ассоциации больших данных и Ксения Дроздова, тимлид команды ML-разработки nlogic, выступили на мероприятии с докладом "Как обеспечить качество данных для ИИ-проектов".
Анна Серебряникова в своем выступление рассказала о важности доступности данных в рамках разработки ИИ-решений и необходимости устранения барьеров при их обработке, обмене и распространении. Отдельное внимание она уделила принципам обезличивания данных, которые обеспечивают безопасность процесса работы с персональными данными. Также Анна обозначила основные требования к формированию качественного датасета, без которого невозможно развитие искусственного интеллекта.

Во второй части доклада Ксения Дроздова еще раз подчеркнула зависимость успеха любого ИИ-проекта от объема и репрезентативности данных. Также на примере реализованного в nlogic кейса по распознаванию судебных документов она продемонстрировала практический аспект работы с данными – этап разметки. На этом этапе в большом количестве примеров выделяются те данные, которые предстоит находить с помощью ИИ-моделей. Ксения рассказала об основных ошибках и о том, чего они могут стоить разработчикам. Она отметила, что качество моделей напрямую зависит от качества размеченных данных, так как невозможно построить эффективную модель машинного обучения, гарантирующую высокое качество, обучаясь на ошибочных примерах. Также Ксения поделилась принципами работы с данными, которые помогут обеспечить успешную промышленную эксплуатацию решений на базе ИИ.

26 февраля / 2021