Два физика, двадцатилетний Ноа Шатти (Noah Shutty) и его научный руководитель Скотт Стивенсон (Scott Stephenson), решили вместо исследования черных дыр и элементарных частиц заняться чем-то более практичным и создали Deepgram — нечто, что вписывается в определение «звуковой Google». На напечатанную фразу сервис выдает аудиофайл, соответствующий запросу.

Поисковый алгоритм Google использует связи между различными сайтами в своей выдаче, алгоритм Deepgram работает аналогично: он полагается на связки в речи, стараясь определить тип фразы и выдать наиболее верный результат. Идея пришла в голову Ноа, когда тот занялся сортировкой своих аудиодневников и видеозаписей. Для того, чтобы у него была возможность быстро найти необходимый файл, он и создал Deepgram, работающий на основе нейросетей.

В итоге проект, который был призван облегчить жизнь одному человеку, разросся и получил 1.8 млн долларов инвестиций от Metamorphic Ventures и Y Combinator, и планирует стать неплохим бизнес-решением. «У компаний есть тысячи часов записанных телефонных звонков», — сказал Стивенсон, и именно их сервис позволит достаточно быстро осуществлять поиск по этой голосовой базе .

От обычного голосового поиска сервис отличает точность распознавания и выдачи: в четырех из пяти случаев Deepgram выдает необходимый результат. Сейчас над развитием «аудио-ИИ» работают около тысячи человек, а среди клиентов ученые называют сервис по починке iPhone под названием iCracked и одну крупную компанию — поставщика камер для североамериканских полицейских.