Когда OpenAI показали своих человечков, играющих в прятки, я удивился, почему ИИ не попытался взломать мир в котором его поселили. Оказывается, пытался и успешно справился! Найденые хаки впечатялют! Смотреть с 4:00
https://youtu.be/Lu56xVlZ40M?t=240
https://youtu.be/Lu56xVlZ40M?t=240
YouTube
OpenAI Plays Hide and Seek…and Breaks The Game! 🤖
❤️ Check out Weights & Biases here and sign up for a free demo: https://www.wandb.com/papers
❤️ Their blog post is available here: https://www.wandb.com/articles/better-paths-through-idea-space
📝 The paper "Emergent Tool Use from Multi-Agent Interaction"…
❤️ Their blog post is available here: https://www.wandb.com/articles/better-paths-through-idea-space
📝 The paper "Emergent Tool Use from Multi-Agent Interaction"…
📖 Макс Тегмарк в книге Жизнь 3.0 приводит забавный диалог:
Представьте себе двух лошадей, которые, глядя в 1900 году на первые автомобили, обдумывают свое возможное будущее.
— Я боюсь технологической безработицы. — Иго-го, не надо быть луддиткой: наши предки боялись того же самого, когда паровые машины стали выполнять их работу в промышленности, а паровозы принялись вместо них тянуть экипажи по рельсам. Но у нас-то сегодня даже больше работы, чем раньше, и она гораздо лучше: мне намного приятнее катать легкую бричку по городу, чем целыми днями ходить по кругу в идиотских шахтах, откачивая воду помпой. — Но что делать, если эта их затея с двигателем внутреннего сгорания действительно выгорит?
— Я уверена, что у нас, лошадей, возникнут новые профессии, о которых мы пока еще даже и не думали. Так же всегда было раньше, взять хотя бы изобретение колеса и плуга.
Представьте себе двух лошадей, которые, глядя в 1900 году на первые автомобили, обдумывают свое возможное будущее.
— Я боюсь технологической безработицы. — Иго-го, не надо быть луддиткой: наши предки боялись того же самого, когда паровые машины стали выполнять их работу в промышленности, а паровозы принялись вместо них тянуть экипажи по рельсам. Но у нас-то сегодня даже больше работы, чем раньше, и она гораздо лучше: мне намного приятнее катать легкую бричку по городу, чем целыми днями ходить по кругу в идиотских шахтах, откачивая воду помпой. — Но что делать, если эта их затея с двигателем внутреннего сгорания действительно выгорит?
— Я уверена, что у нас, лошадей, возникнут новые профессии, о которых мы пока еще даже и не думали. Так же всегда было раньше, взять хотя бы изобретение колеса и плуга.
А вот и другая точка зрения на проблему “AI лишит нас работы!”
На диаграмме показаны самые популярные профессии в США в 2015-ом году. При этом первая профессия, которая появилась в эпоху развития IT находится всего лишь на 21-ом месте по популярности (программисты).
Так что сказать, что IT перевернул рынок труда нельзя. Не то же ли самое будет с AI?
На диаграмме показаны самые популярные профессии в США в 2015-ом году. При этом первая профессия, которая появилась в эпоху развития IT находится всего лишь на 21-ом месте по популярности (программисты).
Так что сказать, что IT перевернул рынок труда нельзя. Не то же ли самое будет с AI?
🚬 Я сейчас работаю над проектом в области AI + ЗОЖ. А вот что пишет по этому поводу Ной Харари в своей новой книге 21 урок для XXI века.
Люди получат лучшее здравоохранение в истории, но именно поэтому они, вероятно, будут постоянно болеть. В нашем организме всегда есть неполадки и всегда есть что улучшить. В прошлом человек ощущал себя совершенно здоровым, пока не чувствовал боль или не начинал страдать от нарушения каких-то функций, например от хромоты. Но к 2050 году благодаря биометрическим датчикам и алгоритмам больших данных болезни будут диагностироваться и лечиться задолго до появления боли или нарушения функций. В результате вы всегда будете считаться «больным» и выполнять те или иные рекомендации алгоритма. А отказавшись лечиться, вы можете лишиться страховки или даже работы – зачем работодателю платить за ваше упрямство?
Одно дело – не отказываться от сигарет, несмотря на статистические данные, связывающие курение с раком легких. Совсем другое – продолжать курить, вопреки категорическому предупреждению биометрического датчика, который обнаружил в верхней доле левого легкого 17 раковых клеток. А если вы решите проигнорировать предупреждение, что будет, когда датчик сообщит информацию вашей страховой фирме, вашему начальнику и вашей матери?
Люди получат лучшее здравоохранение в истории, но именно поэтому они, вероятно, будут постоянно болеть. В нашем организме всегда есть неполадки и всегда есть что улучшить. В прошлом человек ощущал себя совершенно здоровым, пока не чувствовал боль или не начинал страдать от нарушения каких-то функций, например от хромоты. Но к 2050 году благодаря биометрическим датчикам и алгоритмам больших данных болезни будут диагностироваться и лечиться задолго до появления боли или нарушения функций. В результате вы всегда будете считаться «больным» и выполнять те или иные рекомендации алгоритма. А отказавшись лечиться, вы можете лишиться страховки или даже работы – зачем работодателю платить за ваше упрямство?
Одно дело – не отказываться от сигарет, несмотря на статистические данные, связывающие курение с раком легких. Совсем другое – продолжать курить, вопреки категорическому предупреждению биометрического датчика, который обнаружил в верхней доле левого легкого 17 раковых клеток. А если вы решите проигнорировать предупреждение, что будет, когда датчик сообщит информацию вашей страховой фирме, вашему начальнику и вашей матери?
🚙 Очень забавное видео про то как 2 ИИ, обученых парковаться, сражаются за единственное парковочное место.
Сеть была натренирована с помощью обучения с подкреплением (Q-learning), а потом 2 таких сети просто столкнули лбами.
Я вот регулярно наблюдаю такие сети на улицах города 😂
PS. Сеть учили в мире, где была только одна активная машина и парковочное место всегда свободно. И судя по всему не наказывали за столкновения. Вот что получается, когда обучающая выборка не попадает в реальную жизнь.
https://youtu.be/CqYKhbyHFtA
Сеть была натренирована с помощью обучения с подкреплением (Q-learning), а потом 2 таких сети просто столкнули лбами.
Я вот регулярно наблюдаю такие сети на улицах города 😂
PS. Сеть учили в мире, где была только одна активная машина и парковочное место всегда свободно. И судя по всему не наказывали за столкновения. Вот что получается, когда обучающая выборка не попадает в реальную жизнь.
https://youtu.be/CqYKhbyHFtA
YouTube
Two AI Fight for the same Parking Spot
After training a car to park (watch the training here: https://www.youtube.com/watch?v=VMp6pq6_QjI), I decided to put another agent into the environment and let them fight for the same parking spot.
I thought the result was quite fun to watch, so here is…
I thought the result was quite fun to watch, so here is…
🧠 ИИ позволяет решать задачи по поиску закономерностей в очень шумных и косвенных данных. В каком-то смысле это первые проявляения нечеловеческого интеллекта, который мы не можем полностью осознать, но можем успешно использовать. Мои любимые примеры таких задач:
1. Распознавание набираемого текста по звуку печати (https://www.youtube.com/watch?v=2OjzI9m7W10)
2. Распознавание позы людей по отражению wifi сигнала (http://rfpose.csail.mit.edu/)
3. Распознавание изображения, которое видит человек с помощью ЭЭГ-датчиков (https://www.youtube.com/watch?v=nf-P3b2AnZw)
Во всех этих примерах использованы датчики, существовавшие уже в прошлом веке, но появление ML позволило получить с их помощью удивительные результаты!
Думаю, что таких решений вокруг нас очень и очень много, просто мы пока не умеем их замечать, так как еще не привыкли мыслить новыми возможностями.
1. Распознавание набираемого текста по звуку печати (https://www.youtube.com/watch?v=2OjzI9m7W10)
2. Распознавание позы людей по отражению wifi сигнала (http://rfpose.csail.mit.edu/)
3. Распознавание изображения, которое видит человек с помощью ЭЭГ-датчиков (https://www.youtube.com/watch?v=nf-P3b2AnZw)
Во всех этих примерах использованы датчики, существовавшие уже в прошлом веке, но появление ML позволило получить с их помощью удивительные результаты!
Думаю, что таких решений вокруг нас очень и очень много, просто мы пока не умеем их замечать, так как еще не привыкли мыслить новыми возможностями.
YouTube
Keytap: acoustic keyboard eavesdropping
The sound emitted by keystrokes can potentially be used to perform a side channel attack for guessing the text being typed. This is a program that demonstrates such type of an attack.
Webpage: https://ggerganov.github.io/keytap
Source code: https://git…
Webpage: https://ggerganov.github.io/keytap
Source code: https://git…
☢️ Сегодня фреймворки для работы с нейросетями настолько просты и прекрасны, что с ними совершенно невозможно перестать развлекаться - хочется пробовать все новые и новые идеи, постоянно перезапуская обучение. Часто это идет даже в ущерб основной задаче. Я думал, что это что-то новенькое, пока не встретил в книге “Вы, конечно, шутите, мистер Фейнман!” следующий отрывок, где он пишет про механические компьютеры из 1943 года.
…он начал страдать от компьютерной болезни — о ней сегодня знает каждый, кто работал с компьютерами. Это очень серьезная болезнь, и работать при ней невозможно. Беда с компьютерами состоит в том, что ты с ними играешь. Они так прекрасны, столько возможностей — если четное число, делаешь это, если нечетное, делаешь то, и очень скоро на одной-единственной машине можно делать все более и более изощренные вещи, если только ты достаточно умен.
Через некоторое время вся система развалилась. Френкель не обращал на нее никакого внимания, он больше никем не руководил. Система действовала очень-очень медленно, а он в это время сидел в комнате, прикидывая, как бы заставить один из табуляторов автоматически печатать арктангенс X. Потом табулятор включался, печатал колонки, потом — бац, бац, бац — вычислял арктангенс автоматически путем интегрирования и составлял всю таблицу за одну операцию. Абсолютно бесполезное занятие. Ведь у нас уже были таблицы арктангенсов. Но если вы когда-нибудь работали с компьютерами, вы понимаете, что это за болезнь — восхищение от возможности увидеть, как много можно сделать. Френкель подцепил эту болезнь впервые, бедный парень; бедный парень, который изобрел всю эту штуку.
Не узнаете себя, случайно?
А книгу очень советую, хоть она и не про роботов, а про гениального физика, стоявшего у истоков создания атомной бомбы.
…он начал страдать от компьютерной болезни — о ней сегодня знает каждый, кто работал с компьютерами. Это очень серьезная болезнь, и работать при ней невозможно. Беда с компьютерами состоит в том, что ты с ними играешь. Они так прекрасны, столько возможностей — если четное число, делаешь это, если нечетное, делаешь то, и очень скоро на одной-единственной машине можно делать все более и более изощренные вещи, если только ты достаточно умен.
Через некоторое время вся система развалилась. Френкель не обращал на нее никакого внимания, он больше никем не руководил. Система действовала очень-очень медленно, а он в это время сидел в комнате, прикидывая, как бы заставить один из табуляторов автоматически печатать арктангенс X. Потом табулятор включался, печатал колонки, потом — бац, бац, бац — вычислял арктангенс автоматически путем интегрирования и составлял всю таблицу за одну операцию. Абсолютно бесполезное занятие. Ведь у нас уже были таблицы арктангенсов. Но если вы когда-нибудь работали с компьютерами, вы понимаете, что это за болезнь — восхищение от возможности увидеть, как много можно сделать. Френкель подцепил эту болезнь впервые, бедный парень; бедный парень, который изобрел всю эту штуку.
Не узнаете себя, случайно?
А книгу очень советую, хоть она и не про роботов, а про гениального физика, стоявшего у истоков создания атомной бомбы.
👍 Потраясающее видео о синтезе речи голосом знаменитостей от проекта VeraVoice. Послушайте! Путин очень реалистично получается, я бы поверил.
https://youtu.be/WyU-gJ2NTGc
Я обратил внимание на некоторые моменты - общие фразы, например “Уважаемые граждани России. Дорогие друзья” звучат очень реалистично с точки зрения интонации, потому что они ровно в таком виде встречаются в обучающей выборке (это гипотеза, но я в ней практически уверен).
Фразы, которых в выборке скорее всего нет, например: “наши инженеры научили говорить сеть разными голосами” звучат намного менее натурально, интонации там практически нет, возникает эффект того, что “диктор не понимает о чем говорит”.
На это стоит обратить внимание, если вам нужно отличить синтез от реальной записи. Хотя, вряд ли этот совет продержится долго. Еще пара итераций и отличить синтез без специальных средств станет невозомжно.
Второй выдающий эффект - “металлический дребезг”. Здесь он замаскирован под что-то вроде “телефонной записи низкого качества”, но все равно слышен. Это сайд-эффект от обратного преобразования из спектрограммы в звук, от которого полностью никто не может избавиться на сегодняшний день. Особенно слышно на шипящих.
https://youtu.be/WyU-gJ2NTGc
Я обратил внимание на некоторые моменты - общие фразы, например “Уважаемые граждани России. Дорогие друзья” звучат очень реалистично с точки зрения интонации, потому что они ровно в таком виде встречаются в обучающей выборке (это гипотеза, но я в ней практически уверен).
Фразы, которых в выборке скорее всего нет, например: “наши инженеры научили говорить сеть разными голосами” звучат намного менее натурально, интонации там практически нет, возникает эффект того, что “диктор не понимает о чем говорит”.
На это стоит обратить внимание, если вам нужно отличить синтез от реальной записи. Хотя, вряд ли этот совет продержится долго. Еще пара итераций и отличить синтез без специальных средств станет невозомжно.
Второй выдающий эффект - “металлический дребезг”. Здесь он замаскирован под что-то вроде “телефонной записи низкого качества”, но все равно слышен. Это сайд-эффект от обратного преобразования из спектрограммы в звук, от которого полностью никто не может избавиться на сегодняшний день. Особенно слышно на шипящих.
YouTube
Нейросеть научили говорить голосами знаменитостей
Хотите услышать, как звучит персональное поздравление или шутка с вашим именем или именем кого-то из ваших друзей? Скачивайте наше приложение Parodist:
App Store https://apps.apple.com/app/id1489706295
Google Play https://play.google.com/store/apps/detai…
App Store https://apps.apple.com/app/id1489706295
Google Play https://play.google.com/store/apps/detai…
👾 Нейросеть вместо физического движка. Ребята обучили сеть симулировать поведение объектов со сложной физикой (уровня хороших консольных игр) и получили прирост производительности на три порядка по сравнению с полным просчетом по точкам без какой-либо видимой потери в качестве.
https://youtu.be/yjEvV86byxg
Думаю, что в ближайшее время многие трудоемкие алгоритмы будут вытеснены сетями - в первую очередь тот же рейтрейсинг в играх. А следующим этапом всю игру (графику + физику + игровую механику) можно будет оформить в виде одной обученой сети - вот это будет интересно.
Сама публикация: https://static-wordpress.akamaized.net/montreal.ubisoft.com/wp-content/uploads/2019/08/27140237/deep-cloth-paper.pdf
https://youtu.be/yjEvV86byxg
Думаю, что в ближайшее время многие трудоемкие алгоритмы будут вытеснены сетями - в первую очередь тот же рейтрейсинг в играх. А следующим этапом всю игру (графику + физику + игровую механику) можно будет оформить в виде одной обученой сети - вот это будет интересно.
Сама публикация: https://static-wordpress.akamaized.net/montreal.ubisoft.com/wp-content/uploads/2019/08/27140237/deep-cloth-paper.pdf
YouTube
Subspace Neural Physics: Fast Data-Driven Interactive Simulation
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
💻 Ключевое отличие ML от классического программирования в том, что мы используем по сути один и тот же алгоритм для решения сразу всех задач. Да, мы много говорим о тюнинге под конкретную задачу, но основной подход одинаковый что для синтеза речи, что для управления автомобилем. Кажется невероятным, но кажется мы нашли универсальный подход к решению любой задачи.
Вот что об этом пишет Педро Домингос в своей книге “Верховный алгоритм”:
Само наличие компьютеров - серьезнейший признак существования Верховного алгоритма. Если бы вы отправились в начало ХХ века и рассказали, что вскоре будет изобретена машина, которая сможет решать проблемы во всех сферах человеческой деятельности — одна и та же машина для всех проблем, — никто бы не поверил. Вам бы объяснили, что машины могут делать что-то одно: сеялки не печатают, а пишущие машинки не сеют. Затем, в 1936 году, Алан Тьюринг придумал любопытное устройство с лентой и головкой, которая читает и пишет символы. Сегодня оно известно как машина Тьюринга. С ее помощью может быть решена каждая проблема, какую только можно решить с помощью логической дедукции. Более того, так называемая универсальная машина Тьюринга может симулировать любую другую, прочтя с ленты ее спецификацию, — другими словами, ее можно запрограммировать делать что угодно. Верховный алгоритм предназначен для индукции, то есть процесса обучения, точно так же как машина Тьюринга для дедукции. Он может научиться симулировать любые другие алгоритмы путем чтения примеров их поведения на входе и выходе. Равно как многие модели вычислений эквивалентны машине Тьюринга, вероятно, существует много эквивалентных формулировок универсального обучающегося алгоритма. Суть в том, чтобы найти первую такую формулировку, как Тьюринг в свое время нашел первый вариант многоцелевого компьютера.
Вот что об этом пишет Педро Домингос в своей книге “Верховный алгоритм”:
Само наличие компьютеров - серьезнейший признак существования Верховного алгоритма. Если бы вы отправились в начало ХХ века и рассказали, что вскоре будет изобретена машина, которая сможет решать проблемы во всех сферах человеческой деятельности — одна и та же машина для всех проблем, — никто бы не поверил. Вам бы объяснили, что машины могут делать что-то одно: сеялки не печатают, а пишущие машинки не сеют. Затем, в 1936 году, Алан Тьюринг придумал любопытное устройство с лентой и головкой, которая читает и пишет символы. Сегодня оно известно как машина Тьюринга. С ее помощью может быть решена каждая проблема, какую только можно решить с помощью логической дедукции. Более того, так называемая универсальная машина Тьюринга может симулировать любую другую, прочтя с ленты ее спецификацию, — другими словами, ее можно запрограммировать делать что угодно. Верховный алгоритм предназначен для индукции, то есть процесса обучения, точно так же как машина Тьюринга для дедукции. Он может научиться симулировать любые другие алгоритмы путем чтения примеров их поведения на входе и выходе. Равно как многие модели вычислений эквивалентны машине Тьюринга, вероятно, существует много эквивалентных формулировок универсального обучающегося алгоритма. Суть в том, чтобы найти первую такую формулировку, как Тьюринг в свое время нашел первый вариант многоцелевого компьютера.
🦁 Профессия - дрессировщик роботов.
Скорее всего в ближашее время наряду с программистами появится профессия дрессировщика домашних роботов. Домашний робот вероятно будет поставляться с предобученным ИИ, который уже будет снабжен базовыми навыками поведения в домашинх условиях (он из коробки будет распознавать людей, мусор, комнаты, бытовые ситуации, интонацию, обладать навыками навигации по дому и захвата предметов). Человек, который будет добавлять такому роботу новый функционал, будет заниматься дообучением этого ИИ (Transfer learning). А что нужно для успешного дообучения?
- Знать сильные и слабые стороны своего "питомца" - что у него получается хорошо, что плохо, какие есть подводные камни в его поведении и какие фокусы он может предподнести.
- Уметь составлять учебную программу (учебные примеры) таким образом, чтобы "подопечный" максимально быстро учисля нужным навыкам и затем мог применять их в самых разнообразных ситуациях, при этом не приобрел негативных "привычек" и не потерял другие нужные навыки.
- Делать задачи достаточно разнообразными, чтобы их нельзя было зазубрить, но при этом легко было составлять новые (аугментация данных).
- Организовать процесс тренировки (виртуальная или реальная среда) и выбрать правильный подход (обучать на примере или дать ученику самому дойти до решения (Q-learning)).
Так что ждем, что рядом с такими гигантами, как Возняк и Торвальдс скоро оставит свой след какой-нибудь новоявленый Запашный! 🎪
Скорее всего в ближашее время наряду с программистами появится профессия дрессировщика домашних роботов. Домашний робот вероятно будет поставляться с предобученным ИИ, который уже будет снабжен базовыми навыками поведения в домашинх условиях (он из коробки будет распознавать людей, мусор, комнаты, бытовые ситуации, интонацию, обладать навыками навигации по дому и захвата предметов). Человек, который будет добавлять такому роботу новый функционал, будет заниматься дообучением этого ИИ (Transfer learning). А что нужно для успешного дообучения?
- Знать сильные и слабые стороны своего "питомца" - что у него получается хорошо, что плохо, какие есть подводные камни в его поведении и какие фокусы он может предподнести.
- Уметь составлять учебную программу (учебные примеры) таким образом, чтобы "подопечный" максимально быстро учисля нужным навыкам и затем мог применять их в самых разнообразных ситуациях, при этом не приобрел негативных "привычек" и не потерял другие нужные навыки.
- Делать задачи достаточно разнообразными, чтобы их нельзя было зазубрить, но при этом легко было составлять новые (аугментация данных).
- Организовать процесс тренировки (виртуальная или реальная среда) и выбрать правильный подход (обучать на примере или дать ученику самому дойти до решения (Q-learning)).
Так что ждем, что рядом с такими гигантами, как Возняк и Торвальдс скоро оставит свой след какой-нибудь новоявленый Запашный! 🎪
Внезапно все вокруг стали запускать сетку, извлекающую вокал и минусовку из аудиозаписи. Также есть фукнция разделения на отдельные инструменты. Работает просто потрясающе! По сравнению с теми алгоритмическими фильтрами, что были раньше (например, удаление вокала в Audacity), это просто небо и земля - скачок на два порядка минимум! Отдельно стоит отметить, что обработка происходит практически мгновенно даже без GPU.
Прогнал через сеть немного известных песен, послушайте, как она справилась с песней “прекрасное далеко”!
Ссылка на GitHub для самостоятельного запуска: https://github.com/deezer/spleeter
Прогнал через сеть немного известных песен, послушайте, как она справилась с песней “прекрасное далеко”!
Ссылка на GitHub для самостоятельного запуска: https://github.com/deezer/spleeter
GitHub
GitHub - deezer/spleeter: Deezer source separation library including pretrained models.
Deezer source separation library including pretrained models. - deezer/spleeter
🤖 Я жду, что в ближайшее время (1-3 года) на рынок выйдет домашний робот с функционалом бОльшим, чем у пылесоса и ценой до $1000. Это будет устройство со следующими способностями:
a) Навигация и перемещение по дому, распознавание типов комнат
b) Голосовое управление
c) Способность манипулировать небольшими предметами (мелкая уборка, перемещение, сортировка, поиск)
в) CV с распознаванием людей и бытовых предметов
г) API с набором высокоуровневых команд, вроде “взять предмет”, “идти в комнату”, “обход помещения”, “ожидание появления человека в зоне видимости”.
Главный вопрос - варианты применения. Практика показывает, что такой вопрос не в силах решить даже крупная корпорация вроде Apple (вспомните, какие приложения были в первом iPhone), поэтому главным фактором в продвижении такого устройства должен быть магазин приложений (навыков) и SDK для их разработки, тогда независимые разработчики смогут быстро проверить десятки тысяч гипотез и найти области применения, где этот робот действительно будет нужен и полезен.
Технически у нас все уже для этого есть - мобильные чипы уже неплохо справляются с задачами CV и навигации по камерам, а сверх точные манипуляторы при таком подходе не нужны.
Я думаю, что как только такой продукт появится на рынке (например от Amazon или Google), стоит вкладываться в его изучение - разработчикам это даст очень востребованные навыки, бизнесменам - возможность занять лучше места в пока свободной ракете.
А пока посмотрите на очередного кандидата - корейского робота Liku от компании Torooc с неплохим фукнционалом и отличными внешними данными.
http://www.likuwith.me/?ckattempt=1
У них есть канал на YouTube где они показывают работу своих прототипов и пробуют найти кейсы использования - многие очевидно совершенно нежизнеспособные, о чем я выше как раз говорил: https://www.youtube.com/channel/UCDpo9NfE0x4895vlguEj-jw/featured
Да, это не Atlas от Bostom Dynamics, но выглядит достаточно неплохо для домашнего испльзования (хотя я думаю, что первый популярный домашний робот будет больше похож на смесь Amazon Echo и iRobot Roomba).
Хотите, чтобы этот малыш пытался поднимать вещи с полва в вашем доме?
a) Навигация и перемещение по дому, распознавание типов комнат
b) Голосовое управление
c) Способность манипулировать небольшими предметами (мелкая уборка, перемещение, сортировка, поиск)
в) CV с распознаванием людей и бытовых предметов
г) API с набором высокоуровневых команд, вроде “взять предмет”, “идти в комнату”, “обход помещения”, “ожидание появления человека в зоне видимости”.
Главный вопрос - варианты применения. Практика показывает, что такой вопрос не в силах решить даже крупная корпорация вроде Apple (вспомните, какие приложения были в первом iPhone), поэтому главным фактором в продвижении такого устройства должен быть магазин приложений (навыков) и SDK для их разработки, тогда независимые разработчики смогут быстро проверить десятки тысяч гипотез и найти области применения, где этот робот действительно будет нужен и полезен.
Технически у нас все уже для этого есть - мобильные чипы уже неплохо справляются с задачами CV и навигации по камерам, а сверх точные манипуляторы при таком подходе не нужны.
Я думаю, что как только такой продукт появится на рынке (например от Amazon или Google), стоит вкладываться в его изучение - разработчикам это даст очень востребованные навыки, бизнесменам - возможность занять лучше места в пока свободной ракете.
А пока посмотрите на очередного кандидата - корейского робота Liku от компании Torooc с неплохим фукнционалом и отличными внешними данными.
http://www.likuwith.me/?ckattempt=1
У них есть канал на YouTube где они показывают работу своих прототипов и пробуют найти кейсы использования - многие очевидно совершенно нежизнеспособные, о чем я выше как раз говорил: https://www.youtube.com/channel/UCDpo9NfE0x4895vlguEj-jw/featured
Да, это не Atlas от Bostom Dynamics, но выглядит достаточно неплохо для домашнего испльзования (хотя я думаю, что первый популярный домашний робот будет больше похож на смесь Amazon Echo и iRobot Roomba).
Хотите, чтобы этот малыш пытался поднимать вещи с полва в вашем доме?
