ИИ помогает агентству Reuters собирать новости

Oпубликoвaнo: 2017-12-01 10:00:49

Reuters сoвмeстнo с Alibaba испoльзуeт ИИ пoд названием Tracer для отбора новостей через Twitter и проверки их подлинности. В будущем подобные программы могут помочь журналистам справиться с растущим информационным потоком, пишет MIT Technology Review.


Новостные агентства, чтобы выжить в эпоху интернета, стараются внедрять последние технологии написания заметок и поиска информации с помощью искусственного интеллекта. Так, служба новостей в Associated Press использует программу, которая сообщает о событиях, вставляя заголовки в заранее подготовленные шаблоны, вроде: «Компания X о прибыли в размере Y в Z квартале».


Однако Reuters пошло дальше. Недавно агентство внедрило ИИ под названием Tracer, который должен полностью автоматизировать подбор новостей и заодно проверять их на подлинность. Это не значит, что журналисты перестанут быть востребованными — скорее, программа поможет им «переварить» растущий с каждым днем информационный поток, как сообщает сайт новостей финансовых рынков Украины и мира Elcomart.ua.


Над Tracer работают программисты из отдела Reuters Research and Development совместно с Alibaba. Ежедневно ИИ анализирует около 12 млн твитов, что составляет примерно 2% от общего числа постов. Половина из них отбирается совершенно случайно, остальные берутся из списка учетных записей Twitter, отобранных журналистами Reuters. К ним относятся другие новостные организации, крупные компании, влиятельные люди в индустриях, знаменитости и так далее.


На следующем этапе Tracer должен определить, когда произошло событие. С точки зрения алгоритма, — это время, когда о событии начинают говорить несколько человек сразу. Поэтому для этого используются кластерные алгоритмы машинного обучения. Безусловно, помимо реальных новостей в эти кластеры попадает всякий спам, реклама и обычный чат. Поэтому Tracer должен сделать дополнительный отсев.


Для этого он должен определить тему разговора, после чего сравнивает ее с базой данных тем, собранных журналистами из «официальных» аккаунтов, таких как CNN, BBCBreaking, nytimes, BreakingNews. На этом этапе алгоритм также определяет местоположение события, используя базу данных городов и ключевые слова.


Как только разговор или слух потенциально идентифицируется программой как новость, важно выяснить, не является ли она «уткой». Для этого Tracer ищет источник, проверяя ссылки с самого раннего твита в разговоре. Затем «пробивает» их по базе данных «фейковых СМИ», вроде National Report или The Onion.


Наконец, система пишет заголовок с кратким описанием, и распространяет новость по всей международной редакции Reuters.


По словам разработчиков, Tracer оказался довольно точным. Из 12 млн твитов, которые он анализирует, примерно 80% — это «шум». Остальные разделяются на 6 тысяч кластеров, которые классифицируются как отдельные типы новостных событий. Все вычисления проводятся на 13 серверах, использующих 10 различных алгоритмов.


Инф. finance.ua

Внимание!!! При перепечатке материалов с E-FINANCE.COM.UA активная ссылка (не закрытая в теги noindex или nofollow, а именно открытая!!!) на портал «Финансовые новости E-FINANCE.COM.UA» обязательна.