Майбутнє новин — люди, що говорять з машинами

Lookalike переповідає статтю Трушара Барота з BBC про те, що голосові помічники — та частина технічної революції, на яку ЗМІ звертають замало уваги. Але ще є час це виправити.

Цьогоріч iPhone виповнилося 10 років. Його випуск став початком нової ери користувацької поведінки, і це фундаментально змінило правила, за якими контент ЗМІ розповсюджується, сприймається та використовується.

Цього літа я шукав якусь іншу технологію, що могла б спричинити подібний ривок. Я побачив Alexa від Amazon, Google Home та Assistant, Cortana від Microsoft, HomePod, що розробляє Apple. Я говорив з редакційними та технічними командами новинних медіа, що працюють над дистрибуцією контенту на різні платформи.І тепер я знаю: це потенційно вагоміше, аніж вихід iPhone.

Проте як індустрія ми дуже далекі від компаній, що інвестують в AI та машинне навчання. Минулого року CEO технічних гігантів у різні способи говорили, що їхня компанія має AI за пріоритет. Я не пригадую, щоб хтось із керівників компаній нашої індустрії так говорив про AI останнім часом.

Звісно, тут жодних сюрпризів. “Ми не технологічна компанія”.

Проте в результаті AI залишається поза новинною індустрією.

Емі Вебб нещодавно написала: “Розмови з машинами, а не набирання текстів щоб з ними порозумітися, ніяка не дивина. Люди, які говорять до машин, — та й іноді машини, що говорять одне до одного, — означають найближчий великий етап нашої медійної екосистеми. Голос — наступний великий виклик для журналістики”.

Говорити з об’єктами більше не дивакувато

В останній версії щорічного звіту цифрових трендів, Мері Мікер виявила, що близько 20% пошуку в Google — це голосовий пошук. Продажі голосових пристроїв типу Amazon’s Echo теж значно пришвидшилися.

Стає ясно, що люди звикають до взаємодії з пристроями через голос.

“Ми розглядаємо голос як третю хвилю технологій, після “наведи та клікни” на десктопі та тач-інтерфейсах смартфонів”, — каже Францеско Марконі, медіа-стратег Associated Press.

Від релізу Echo, чимало компаній пробували зрозуміти, як у цій системі працює (або ж не працює) контент.

Радійщики мають тут неймовірну перевагу, адаптуючи свій контент.

Що робить NPR

У США, NPR були серед перших, хто почав працювати у цьому середовищі. Ха-Хоа Хамано, старший продуктовий менеджер NPR по роботі з AI, говорить, що радіо має лише 32% аудиторії, тому спікери — логічний шлях розширення аудиторії там, де вона хоче слухати. NPR були доступні на запуску Echo та Google Home, і скоро будуть у HomePod.

Завдяки API, за яким працюють NPR, їм було нескладно інтегрувати контент в систему Amazon. Їхні “уміння” для Alexa (додатки, які спікер може розрізняти) можуть відповідати на запити типу “Алексо, попроси NPR One порекомендувати подкасти” або ж “Алексо, попроси NPR One зіграти Hello Адель”.

Експерименти The Washington Post

The Washington Post, що належить Amazon CEO Джефу Безосу, так само від початку експериментує зі смарт-спікерами.

The Washington Post не радійщики, тому мусять експериментувати із різними формами аудіо — починаючи від автоматичного відтворення голосом Алекси своїх текстів із сайту, до журналістів, що начитують історії власним голосом.

У них був і невдалий експеримент, коли вони запустили олімпійське “уміння” Alexa: вона на запит повідомляла результати ігор. Але проблема в тому, що Amazon зробив те саме базовою функцією спікера. І новинна компанія зрозуміла, що коли є публічні дані, які ніяк не пов’язані з брендом ЗМІ, люди питатимуть — “Алексо, розкажи про медалі”, а не “Алексо, покажи, що The Washington Post повідомляє про медалі”.

Медійники повинні розуміти, де та ексклюзивна інформація, яку не може надати базовий інтерфейс Alexa.

Один із напрямків, над яким працює команда The Washington Post, є сповіщення на Alexa та Google’s Home. Наприклад, у разі гарячих новин Post зможе змусити спікер дзвеніти та активувати зелений сигнал.

Користувач зможе спитати — “Алексо, що ми пропустили?” чи “Алексо, що там з моїми сповіщеннями?”

Такі видавці, як The Washington Post, що не мають аудіоконтенту, повинні добре попрацювати, щоб зрозуміти своє місце в цій інфраструктурі.

Дуже легко масштабувати процес, коли аудіо робиться зі статей на сайті. Важче — удавати, що журналісти читають свої історії, хай навіть із їхнім записаним голосом. Проте людям це більше подобається.

Шлях CNN

Для телевізійників, наприклад CNN, ранні експерименти були націлені на те, щоб виявити — коли саме їхня аудиторія хоче слухати історії.

Наприклад, як вони виявили, більшість користувачів тримають спікер на кухні. То що ж вони роблять уранці на кухні? Готують сніданок? Скільки часу треба, щоб зготувати бейгель — 5 хвилин. І це їхній час на дистрибуцію — 5 хвилин, поки готується бейгель. Компанії намагаються зрозуміти, де і як проводять час слухачі: вони миють посуд? Бачать рекламу на ТБ? чистять зуби? ЗМІ змагаються з безліччю опцій реального життя.

Також CNN задумується над тим, як працюватимуть сповіщення. Якщо надіслати сповіщення опівдні, а людина буде вдома увечері? Як потрапити у правильний час, правильний простір?

Голосовий АІ: що відбувається зараз

  • Випуски новин (NPR, BBC, CNN)
  • Подкасти (NPR)
  • Тести (The Washington Post)
  • Рецепти (Hearst)

Користувачі

Аудиторія спікерів не схожа на аудиторію любителів нової техніки. Спікери часто отримують у подарунок, — наприклад, на Різдво. І тому бар’єр входження в систему — досить низький у технічному плані.

Нижче наведено причини хотіти смарт-спікер: найперше це, звісно, музика. З появою спікерів їхні власники починають слухати більше музики, більше новин та подкастів.

Говорити до Алекси — це інтуїтивний процес.

Якщо ви не переконалися, що голосовий інтерфейс, — це новий інтерфейс, гляньте як діти із ним взаємодіють. У них немає проблем із тим, щоб говорити до пристрою. Спікери допомагають розважати дітей різного віку. Тому розробляти голосовий продукт для дітей — чудова можливість. (Цікаво, що у діти у спілкуванні зі смарт-спікерами отримують бажане без “будь ласка” і “дякую” і швидко стають нечемними; компанії розробляють варіанти “чемного” дитячого контенту).

До того ж спікери — це пристрій загального доступу. Він говорить на всіх присутніх, на відміну від смартфона, тому спрощує та покращує родинне дозвілля.

Виклики: відкриття, дистрибуція, аналітика, монетизація

В усіх моїх розмовах з продуктовими та редакційними командами, що працюють у ЗМІ з голосом, найбільшою проблемою поставала “знаходжуваність” такого контенту: як люди про нього дізнаються та його знайдуть?

З екраном усе просто: магазини з додатками, соціальні мережі, веб-сайти. З голосом усе складніше: хоча пов’язані мобільні додатки допомагають зрозуміти, що може спікер, проте це не природній шлях для користувачів.

Якщо я скажу: “Йой, Алексо/Гугл/Сірі, що там сьогодні в новинах?” — що буде робитися в спікері, щоб він доніс до мене найточнішу відповідь?

Великі бренди, безперечно, мають тут перевагу. У Сполученому Королівстві більшість користувачів, яким потрібні новини, спитають у BBC. У США це може бути CNN чи NPR. Брендам, які не мають телевізійної чи радіо присутності, буде складніше отримати увагу аудиторії. Малоймовірно, що в цій ситуації люди питатимуть новини у газети.

Крім цього, технічним компаніям треба провести ще багато роботи, щоб навігація контентом була легшою і яснішою. І вони над цим працюють.

Зараз, вмикаючи спікер, ви через пов’язаний додаток можете вибрати джерела, з яких хотіли б отримувати інформацію. Проте як ви запам’ятаєте, як туди повернутися? Немає жодних стандартних голосових команд, які б допомогли.

Ще одна проблема — як розробити систему контенту? Як його тегувати, щоб голосовий помічник розумів його релевантність?

Голосові інтерфейси виходять за рамки спікерів: вони скоро будуть усюди, на роботі, в машині, в інших побутових ситуаціях. Тому тегування контенту може вийти на інший рівень — щоб голосові помічники розуміли, де ти і що робиш, і підлаштовували “спілкування” із власником до ситуації. Це ті питання, на які потрібно відповідати, щоб тегувати контент для дистрибуції на нові платформи.

Для цього надважливою є спільна робота спеціалістів індустрії.

Дані та вимірювання успіху

Звісно, зараз у нас немає даних: ані про те, що ми робимо, ані про нашу аудиторію. Видавці шукають способи інтегрувати свої аналітичні системи в Amazon Echo та Google Home, технологічні компанії віддають деякі дані, проте цього замало.

З якою емоцією людина використовує певну функцію чи додаток?

Зі смарт-спікерами нам необхідно переосмислити стандартні метрики, такі як унікальні користувачі, час взаємодії та залученість.

Наприклад, що таке хороший показник залученості — це період часу, коли людина говорить до свого пристрою? Кількість разів, коли вона використовує певну функцію? Нова неймовірна метрика, яка може з’явитися у майбутньому — з якою емоцією людина використовує певну функцію чи додаток? Це можливо, якщо визначити тон її голосу.

І зрештою гроші

Як монетизувати ці платформи? Звісно ж, видавці прагнуть спробувати нові технології, коли розуміють, як вони можуть привести нову аудиторію чи гроші. Логічне бажання у даному разі — через спікери привести реферальний трафік та збільшити підписки.

Проте, найкращий приклад тут може дати радіо. Люди звикли до самої природи реклами на радіо і ставляться до неї більш толерантно, аніж до поп-апів на сайтах.

Одна із перших рекламних мереж для смарт-спікерів, розроблена VoiceLabs, дала перші ідеї щодо того, як такі системи можуть працювати у майбутньому: це інтерактивна реклама, що спілкується з користувачем. Проте після оновлення правил від Amazon VoiceLabs пригальмувала роботу мережі. З іншого боку, нові правила поки що дозволяють рекламу в новинних блоках, подкастах та стрімінгу.

Інша можливість отримувати дохід — e-commerce. Люди можуть із власних акаунтів робити голосові замовлення після реклами.

Для ЗМІ, які не мають досвіду мовника і сконцентровані онлайн, прикладом може бути Washington Post. В наступні місяці завдяки своєму зв’язку з Amazon видання спробує декілька моделей монетизації. Це може бути мікс зі спонсорського контенту, аудіореклами та посилань на свої ресурси та додатки. Також Amazon зможе надати ці та інші механізми своїм партнерам для тесту.

Відоме невідоме та невідоме невідоме

Якщо певні виклики — навігація контентом, тегування, монетизація — ми досить добре можемо зрозуміти і працювати з ними, є й інші, з якими поки усе не так ясно.

Наприклад, є думка, що справжній досвід голосових новин мусить імітувати звичайну людську розмову. Щоб людина не слухала подкаст чи випуск новин — а спілкувалася із брендом ЗМІ, з його журналістами та ведучими.

Навіщо слухати випуск CNN, якщо можна поговорити із Андерсоном Купером? Це не обов’язково мусить бути справжній Андерсон Купер, але додаток з його голосом та рисами його особистості. Так само можна працювати з відомими спортивними оглядачами та ведучими.

Такий підхід дасть тісний зв’язок із брендом, унікальний досвід, що може реалізуватися лише у цьому інтерфейсі.

Ще один приклад — це розважальні шоу, які зможуть буквально переносити аудиторію у програму. Уявіть реаліті-шоу, де замість того, щоб зводити героїв у студії, продюсери просто включаються до них додому, звідки й відбувається дія. З екранами та камерами, що йдуть разом з деякими смарт-спікерами, ток-шоу зможуть самі заходити додому до своїх глядачів.

Скажи це уголос

Цікаво, що люди використовують спікери у вітальнях, на кухні, у ванній. Додатки можуть робити контент, що актуальний у певній локації.

Колискові чи казки на ніч можуть допомагати дітям засинати

Hearst Media вже успішно випустив для одного зі своїх журналів кулінарний додаток для Alexa, спеціально для кухні. Колискові чи казки на ніч можуть допомагати дітям засинати.

За даними індустрії, спікери можуть стати замість смартфонів тими пристроями, з якими ми комунікуємо одразу після пробудження та перед сном.

Якщо брати це до уваги, то чи можливий додаток, спеціально розроблений для того, щоб залучати нас у перші хвилини після сну? Зараз ми тягнемося за телефоном. Чи можливо, щоб ми замість цього говорили зі спікером?

Стосунки: усе складно

У роботі зі спікерами існують етичні “сірі зони”.

Зокрема, NPR-Edison виявили, що люди дуже швидко емоційно прив’язуються до голосового помічника — так, як це не трапляється зі смартфоном, сайтами, радіо чи ТБ. Людям стає не так самотньо, вони відчувають те саме, що й заводячи домашнього улюбленця.

Юдіт Донат, фахівець Berkman Center for Internet and Society, пояснює: “Ці пристрої створені так, щоб їх хотілося антропоморфізувати. Люди намагаються їм догоджати — ви цього не робите з газетами. Якщо ви отримуєте новини з Alexa, ви отримуєте їх від Алекси, а не голосом The Washington Post чи Fox News

Можливий наслідок цього для новин — люди перестануть розрізняти бренди з їх тоном та редакційними політиками. Їх усі буде говорити один голос.

Спікери налаштовані чути усе

Також у цих пристроях розвиватимуться сповіщення, відповідно, ЗМІ захочуть віддавати туди гарячі новини. Але спікери часто стоять у вітальнях і їх чує уся родина. Іноді гарячі новини — це погані новини, і ми отримуємо етичну проблему: чи має таку інформацію чути дитина? Чи можемо ми розробити якість запобіжні інструменти?

Інша етична проблема — особисті дані. Спікери налаштовані чути усе. Це “усе” записується? Чи існують невідомі нам ключові фрази, що певним чином спрацьовують і передають нашу інформацію? І хоча компанії запевняють, що створюють смарт-спікери за усіма правилами охорони приватності, поки що людей ця проблема непокоїть.

ЧИТАЙТЕ КЕЙСИ:

Facebook Watch: що це таке і як платформа працюватиме з відео

Як BBC News працює з Instargam Stories

Як заробляє проект The Devochki

Як ТСН.ua зробив 100 млн переглядів у Facebook

Також

Як кулінарний гігант Tasty від BuzzFeed виходить в офлайн

Facebook пояснив видавцям роботу стрічки новин

Facebook Explore Feed: що це і чому видавці занепокоєні

Google AMP: більше переглядів, менше грошей?

BuzzFeed запускає нові рекламні продукти, щоб працювати швидше

Тепер кожен автор може заробити на Medium. Як?