Доступність посилання

ТОП новини

Відкриті дані під час війни: що вони дають для розуміння теперішнього і майбутнього


Yale SOM dataset: публічні (відкриті) дані, зібрані групою дослідників Єльського університету (США)
Yale SOM dataset: публічні (відкриті) дані, зібрані групою дослідників Єльського університету (США)
(Рубрика «Точка зору»

У першу декаду березня світова спільнота відзначала Дні відкритих даних. Традиція відзначати ці дні була започаткована ще у 2010 році для популяризації концепції відкритих даних та їх застосування для вирішення важливих суспільно-політичних, економічних та бізнесових проблем.

Цьогорічні Дні відкритих даних були присвячені особливій темі – відкриті дані та системи штучного інтелекту (ШІ, AI). Експерти та зацікавлені громадські активісти всього світу обговорювали наступні питання:

  • Як виглядає шлях від відкритих даних до Штучного Інтелекту (ШІ)?
  • Як штучний інтелект використовувався або може бути використаний для вирішення нагальних світових проблем?
  • Як відкриті дані та штучний інтелект можуть проілюструвати актуальність різних підкатегорій, таких як зміна клімату, прозорість бюджету, право власності, картографування та багато іншого?

Як бачимо, цього року обидва стратегічні напрямки світової «діджиталізації» опинилися водночас у фокусі уваги професіоналів та ентузіастів-аматорів.

Це не набуло великого розголосу в Україні, зосередженій на стримуванні агресії Росії. Однак ці події надають нам ще один привід замислитися над післявоєнними реаліями в Україні, коли після перемоги постануть завдання, фігурально кажучи, «не програти мирне життя».

Відкриті дані як ключ до майбутнього

Уже очевидний факт, що попри війну, Україна розвивається – інституційно, безпеково, «діджиталізаційно».

… Ще у 2015 році Оксана Маркарова та її тодішня команда в Міністерстві фінансів заклали стратегічні підвалини для розвитку екосистеми відкритих даних в Україні (проєкт e-Data та відповідний портал https://edata.gov.ua/). У той час, коли словосполучення «відкриті дані» однаково лякали як пересічних обивателів, так і «непересічних» можновладців старого гатунку, в Україні вже «прочинилося вікно» для опановування найкращого світового досвіду.

У грудні 2022 року, майже через сім років після тих подій, правильність ухвалених тоді рішень та визначеного вектору розвитку «державної діджиталізації» було підтверджено міжнародною спільнотою – Україна була визнана другою (з-поміж 35 європейських країн) у ранзі Open Data maturity (зрілість екосистеми відкритих даних).

Тож, незважаючи на війну й викликаний нею вал економічних і соціальних проблем, у царині побудови екосистеми відкритих даних Україна продовжує впевнений поступ. Але є деякі «але»…

Відкриті дані: людський вимір

Надійна й розвинута екосистема відкритих даних – це один із перших кроків до відкритості й прозорості суспільних процесів.

Однак в сучасних українських реаліях, попри визначні успіхи у створенні відповідної інфраструктури відкритих даних, є істотна проблема – надто пасивна участь громадян у роботі з відкритими даними.

Тобто відкриті дані існують, але без людей, що їх читають, обробляють, інтерпретують та чинять відповідно до висновків і результатів аналізу, вони нічим не допоможуть у вирішенні критичних проблем .

Причини такої ситуації кореняться, на мій погляд, у цілій низці інституційних та соціальних чинників, що діяли в нашому суспільстві ще до широкомасштабної фази війни з Росією, а саме:

  • Відсутність достатньої кількості людей з активною життєвою позицією та масова схильність широких верств до патерналізму.
  • Недостатня кількість фахівців із потрібними для аналізу та інтерпретації відкритих даних навичками (тут необхідним є поєднання публіцистично-словесних та комунікаційних навичок та володіння певними технологіями програмування та програмними засобами, що дотичні до обробки даних та візуалізації інформації).
  • Невираженість комунікаційних та медійних феноменів, стимульованих усталеною культурою роботи із відкритими даних у західному світі, в Україні, а саме таких як журналістика даних (data journalism), аналітична складова щодо обробки відкритих даних у діяльності вітчизняних журналістів-розслідувачів, «громадська журналістика» (Citizen journalism) як масовий суспільний феномен.

Однак широкомасштабна фаза війни з Росією змінює ситуацію і тут.

Через те, що величезна кількість наших співгромадян були змушені докорінно змінити життя й вийти зі своєї звичної зони комфорту, вимушено зростає відсоток людей із активною життєвою позицією.

Окрім того, урядові програми масової перекваліфікації працездатних професіоналів для набуття відповідних професій в сфері IT та розробки програмного забезпечення, започатковані у 2022 року, сприятимуть покращенню навичок володінням відповідними технологіям програмування й обробки даних серед інтелектуалів.

А це, своєю чергою, стимулюватиме появу більшої кількості людей із комбінацією необхідних гуманітарних та технологічних навичок, що є вагомими при аналізі відкритих даних. Саме тому я сподіваюсь, що невдовзі ми побачимо спалах інтересу до відкритих даних серед активних верств наших співгромадян.

Види робіт із відкритими даними

Загалом, коли згадують про роботу з відкритими даними, варто розрізняти дві досить різні за змістом та технологічними засобами види діяльності:

  • Обробка структурованих публічних наборів даних.
  • Пошук і обробка неструктурованої інформації за відкритими джерелами (і до цього дотичним є поняття розвідки за відкритими даними – OSINT).

Широкомасштабна фаза війни виступила потужним каталізатором розвитку обох напрямків. Розглянемо це на двох специфічних прикладах.

OSINT в Україні за часів широкомасштабної фази війни

Відсіч російській агресії призвела до постання цілої плеяди груп та колективів «кібернетичних бійців невидимого фронту», що застосували різноманітні засоби й методи OSINT для боротьби з російськими загарбниками.

Від 2014 року розпочала свою діяльність найперша й нині найвідоміша з них – InformNapalm. На їхньому рахунку ретельна аналітика та фіксування агресивних дій підрозділів російської регулярної армії на території України, починаючи від перших днів анексії Криму та вторгнення на Донбасі і дотепер. Окрім того, саме їхні матеріали щодо розслідування трагедії зі збитим пасажирським літаком MH17 стали одним із найвагоміших джерел у розслідування JIT та рішення суду в Гаазі у цій справі.

Однак перехід війни з Росією до широкомасштабної фази 24 лютого 2022 року призвів до «широкої мобілізації» професіоналів відповідних профілів до ведення розвідки OSINT, спрямованої проти агресора.

На додачу до гурту InformNapalm, що продовжував здійснювати розвідувальні й аналітичні операції, на передньому краї кібернетичного фронту постали інші групи OSINT-розслідувачів –OSINT-Бджоли, Molfar та інші.

Ці групи, досліджуючи відкриті джерела інформації (соціальні мережі, інтернет-публікації, архіви відео- та фото-інформації тощо), сприяли й сприяють ретельному виявленню й документуванню воєнних злочинів російської армії, а також допомагають кінетичним військовим підрозділам ЗСУ ефективніше знищувати ворога на полі бою. Ці дії виявилися настільки ефективними, що деякі світові експерти схильні називати широкомасштабну фазу російсько-українську війну «першою цифровою війною».

Обробка структурованих даних про вихід міжнародного бізнесу з РФ

Щоб показати, яким чином обробка структурованих публічних наборів даних може бути корисною для оборони України під час війни, хочу навести результати власного дослідження, присвяченого тенденціям виходу міжнародного бізнесу з Росії у 2022 році у світлі немотивованої агресії проти України та скоєння російськими військовими численних злочинів та терористичних актів проти цивільних осіб та цивільної інфраструктури України.

Як джерело структурованої інформації я використовував публічні (відкриті) дані, зібрані групою дослідників Єльського університету (США) - Yale SOM dataset.

Ми бачимо, що більшість міжнародних компаній, охоплених дослідженням, приступили до повного або значного виходу з Росії. Відносна частка таких компаній у країнах G7 набагато більша, ніж у решті світу. Ми можемо інтерпретувати це як намір бізнес-еліт у глобальних компаніях підтримувати цінності демократії, свободи та нетерпимості до державного тероризму на противагу агресивному тоталітаризму та тероризму, які проявила російська агресія в Україні.

У той же час ми спостерігаємо кластер країн, які схильні або підтримувати російську агресію, прямо чи опосередковано (як Китай), або просто отримувати короткострокові вигоди від роботи на російських ринках під час масового відтоку з нього глобальних гравців (Індія, Бразилія та деякі країни ЄС, які бачать післявоєнний світоустрій З РОСІЄЮ, а не ПРОТИ РОСІЇ – Італія, Франція та, дедалі меншою мірою з часом, Німеччина).

З точки зору галузей ми це бачимо, що:

  • найбільшими кластерами компаній, які пішли з Росії, є «категорія b – Споживчі дискреційні – G7», «клас b – Споживчі дискреційні – інші країни», «клас b – Інформаційні технології – G7», «клас b – Промислові – G7», «клас b – промисловість – інші компанії» та «клас a – промисловість – G7»
  • найбільший кластер компаній, які вирішили залишитися в Росії, це «категорія f – промисловість – інші компанії»
  • У той же час ми бачимо, що багато рішень (особливо в енергетиці та фінансах) продиктовані політичними причинами «реальної політики», а не ціннісними рішеннями топ-менеджерів відповідних країн. Наприклад:
  • Китайські та індійські фінансові установи/компанії змушені масово вийти з Росії через ризик потрапити під вторинні санкції США, Великої Британії та ЄС.

Відносно великий відсоток західних компаній в енергетичній галузі, які вирішили продовжити свою діяльність у Росії, керуються:

  • характером видобутку нафти/газу,
  • врахованим політично мотивованими рішеннями ((1);
  • обмеженням найвищої ціни на нафту Urals і газ,
  • тим, що видобувається в Росії,
  • (2) обмеженнями на операції з ядерною енергетикою з/у Росії,
  • (3) супутніми фінансовими обмеженнями на операції, пов’язаними з енергетикою, з російськими компаніями тощо).

Існують як ціннісні, так і політичні чинники, які впливають на рішення бізнесу вийти з Росії на тлі її агресії проти України.

З повним англомовним текстом дослідження можна ознайомитися за посиланням, а для тих, хто хотів би відстежувати логіку обробки даних, їхнього аналізу та інтерпретації, корисним може бути перегляд репозиторію із програмним кодом розроблених мною аналітичних інструментів.

А як же штучний інтелект?

Власне, в цій історії локомотивом знову стане приватний бізнес.

Як відомо, в світі існує ціла низка надзвичайно прибуткових компаній, чиї бізнес-моделі та сервіси напряму використовували відкриті (публічні) дані.

І хоча Україна, як згадувалося вище, розпочала свою мандрівку в світ відкритих даних відносно пізно (порівняно з багатьма іншими країнами світу), в нас теж дещо було зроблено в цій царині.

Мабуть, найвідомішим серед успішних вітчизняних рішень є сервіс перевірки контрагентів YouControl, що на основі відкритих даних формує досьє на компанії. Як зізнавався колись сам засновник YouControl Сергій Мільман, за 2020 рік його бізнес показав ріст на 35%.

Також, можна згадати ще низку успішних проєктів такого типу, а саме:

  • OpenDataBot, котрий акумулює інформацію про юридичних осіб, допомагає моніторити стан компаній та запобігати рейдерству;
  • система пошуку донорів «ДонорUA»;
  • сервіс «Суд на долоні»;
  • сервіс юраудиту нерухомості Monitor.estate;
  • сервіс громадського транспорту EasyWay та багато інших.

Саме тому в Україні є достатньо професійних колективів та бізнес-організацій, що зможуть створити якісні та етичні системи ШІ, що працюватимуть на основі публічних даних.

Нині органи влади в Україні збирають величезну кількість даних про все: від охорони здоров’я до житла, економічного розвитку та національної безпеки. Урядові установи також створюють і оприлюднюють такі дані, як дані перепису населення, інформацію про фінансовий ринок, дані про погоду, транспортні маршрути тощо.

Ці великі загальнодоступні набори даних можуть допомогти в розробці прогнозних моделей та інструментів ШІ, які можуть створити цінність як для державного, так і для приватного секторів і, що найважливіше, для масових споживачів.

Наприклад:

  • державні дані про охорону здоров’я можуть допомогти лікарям, лікарням і фармацевтичним компаніям покращити існуючі варіанти лікування та навіть створити нові ліки.
  • компанії, що задіяні в сферах електронної комерції та торгівлі онлайн, зможуть, використовуючи дані з певних державних реєстрів, краще обслуговувати своїх клієнтів з першого візиту на їхні портали, створюючи більш персоналізовані під кожного з клієнтів пропозиції.
  • фінансові компанії, використовуючи певні відкриті дані щодо кредитної історії чи репутації контрагентів, зможуть краще оцінювати фінансові та кредитні ризики взаємодії з потенційними клієнтами

...Серед українців ще й досі є поширеним архетиповий міф про козака Мамая. Такий собі мовчазний звитяжець, музикант і мудрець, що якось , наче без зусиль, вирішує найскладніші проблеми, а сіроманці-посполиті чекають на нього, аби він дав ладу й їхнім негараздам.

Однак в цих міфах 'забули' розповісти важливу річ – козаком Мамаєм (або ж його дуальною парою – Вогонь-молодицею) може стати кожен/кожна з нас. Фаза післявоєнної відбудови країни продемонструє це в усіх критичних сферах соціально-політичного й економічного життя, включаючи й подальший розвиток екосистеми відкритих даних та кваліфікованих спільнот, що регулярно працюють з ними у своїй щоденній діяльності.

Георгій Вишня – управлінець у сфері IT, фахівець із систем штучного інтелекту, машинного навчання, есеїст.

Думки, висловлені в рубриці «Точка зору», передають погляди самих авторів і не конче відображають позицію Радіо Свобода

  • Зображення 16x9

    Георгій Вишня

    Георгій Вишня – управлінець у сфері IT, фахівець із систем штучного інтелекту, машинного навчання, есеїст.

ВИБІР ЧИТАЧІВ

XS
SM
MD
LG