Главные вкладки

Выступление на Hacks/Hackers 2014

hacks-hackers-sm

23 января минское сообщество Hacks/Hackers во второй раз организовало междисциплинарную встречу журналистов и IT-специалистов. Большое спасибо команде организаторов - Марине Клиновой, Наталье Афанасьевой, Кристине Шведа и Вадиму Станкевичу - за интересную программу мероприятия!

По традиции, встреча Hacks/Hackers состоит из двух частей: сначала доклады, потом дискуссия. В прошлый раз участники дискуссии обсуждали будущее белорусского IT-сектора ("Когда в Беларуси появится свой Apple?"), а в этот раз темой разговора было будущее белорусской журналистики: "Как сделать New York Times и Guardian в Беларуси: мозговой штурм IT-специалистов и журналистов".

Ниже тезисы моего выступления на круглом столе (дискуссия так повернулась, что я успел рассказать только часть из этого):

0. Коллеги, я начну немного старомодно. Как известно, у нас в республике есть Конституция, в которой есть статья №34, которая гарантирует белорусским гражданам право на получение, хранение и распространение полной, достоверной и своевременной информации о деятельности государственных органов, общественных объединений, о политической, экономической, культурной и международной жизни, состоянии окружающей среды.

1. С другой стороны, существует точка зрения, дескать белорусское государство утаивает от своих граждан информацию. Это, безусловно, тема для отдельной и долгой дискуссии. Но я хотел бы сформулировать проблему так: мы могли бы гораздо более эффективно использовать ту обильную информацию, которую государственные органы уже публикуют. Это позволило бы избавиться от целой стаи уток, которая обитает в нашем информационном поле.

2. Например, утка о том, что Беларусь занимает первое место в мире по численности милиции на душу населения (российская утка). Или что в государственном бюджете расходы на оборону превышают расходы на образование, здравоохранение и культуру (наша утка). Сегодня у нас достаточно данных, чтобы подстреливать таких уток на взлете. Другое дело, что работа с соотв. данными нередко затруднена по техническим причинам.

3. Поясню в чем вижу проблему. И Белстат, и НЦПИ, и отдельные министерства и ведомства регулярно публикуют в Интернете ценные общественно полезные документы (сборники Белстата, нормативные акты, ведомственные отчеты). Но по традиции эти документы публикуются в формате, предназначенном для распечатки на бумаге, что очень затрудняет машинный анализ этих данных. Для многих пользователей этой информации формат pdf (или doc) остается сложным для преодоления барьером. И наоборот, отсутствие машиночитаемых данных сдерживает развитие как культуры работы с информацией у пользователей, так и развитие самих СМИ и в частности Байнета.

4. Снятие этого барьера позволит не только повысить качество информационных материалов, которые производятся в Беларуси и о Беларуси, но и создаст условия для производства новых, технологичных информационных продуктов. Сегодня данные - это не только "цифры", которые журналист может включить в статью или сюжет. Машиночитаемые данные - это практически неисчерпаемый капитал, на основе которого можно строить постоянно действующие информационные приложения. В мире уже много примеров (OKFN, SunLight и др. инициативы).

5. Серьезная работа с данными возможна в том случае, если государство их целенаправленно публикует в машиночитаемом формате. Т.е. на уровне правительства должна быть принята соотв. инструкция (закон или директива). У нас этого пока нет. Поэтому приходится двигаться снизу, собирать и раскрывать данные самостоятельно и показывать государству пример такой работы.

6. Примеры данных. Общественная безопасность (актуальная информация о пожароопасности, уровне преступности, качестве окружающей среды), социально-экономическое развитие (демография, цены, внешняя торговля), бюджетная политика (республиканский и местные бюджеты), и многое другое. Сегодня этот огромный ресурс информации по большей части пылится в архивах государственных органов. А ведь его можно пустить в дело.

7. Что мы можем сделать. Во-первых, определиться со спросом. Если у профессионального сообщества есть спрос на машиночитаемые данные, то нужно этот спрос обозначить и развивать. Как минимум, мы можем сами создавать пилотные проекты на основе открытых данных. Одновременно следует при каждом удобном случае обозначать этот свой интерес перед представителями государства.

P.S. В ходе обсуждения я навскидку оценил посещаемость популярного Guardian Datablog в "несколько сотен тысяч посещений". Признаюсь, что точной цифры не знаю, а эта цифра взята с потолка. Тем не менее, по данным comScore в декабре 2011 года весь сайт газеты Guardian замкнул пятерку самых посещаемых сайтов в интернете. Его посещаемость в декабре составила 29,15 млн уникальных посетителей.