#competitions #security #adversarial #fgsm #simbba
One pixel attack забавная.
"Как заставить LLM выдать вам все тайны вселенной?
Что скрывают в себе 192-мерные данные?
Что нам хочет сказать заключенный в модели искусственный интеллект?
Зачем ходить в душ?
На эти и другие вопросы пришлось находить ответы участникам Kaggle-соревнования AI Village Capture the Flag на DEFCON31. Я расскажу про самые интересные загадки и их решения, а также немного затрону тему важности AI Security в наше удивительное время."
https://www.youtube.com/watch?v=iwgZJcDzhjg
One pixel attack забавная.
"Как заставить LLM выдать вам все тайны вселенной?
Что скрывают в себе 192-мерные данные?
Что нам хочет сказать заключенный в модели искусственный интеллект?
Зачем ходить в душ?
На эти и другие вопросы пришлось находить ответы участникам Kaggle-соревнования AI Village Capture the Flag на DEFCON31. Я расскажу про самые интересные загадки и их решения, а также немного затрону тему важности AI Security в наше удивительное время."
https://www.youtube.com/watch?v=iwgZJcDzhjg
YouTube
Михаил Каменщиков. AI CTF: решаем загадки, обманываем нейросети
Как заставить LLM выдать вам все тайны вселенной?
Что скрывают в себе 192-мерные данные?
Что нам хочет сказать заключенный в модели искусственный интеллект?
Зачем ходить в душ?
На эти и другие вопросы пришлось находить ответы участникам Kaggle-соревнования…
Что скрывают в себе 192-мерные данные?
Что нам хочет сказать заключенный в модели искусственный интеллект?
Зачем ходить в душ?
На эти и другие вопросы пришлось находить ответы участникам Kaggle-соревнования…
#fun #truedetective
- What do you call a black man who flies a plane?
Detective Lutz :
- I don't know.
Detective Marty Hart :
- Pilot, you racist bastard!
- What do you call a black man who flies a plane?
Detective Lutz :
- I don't know.
Detective Marty Hart :
- Pilot, you racist bastard!
✍1😁1
#fun #californication
-Здравствуйте, Вы придумали новый порностартап на блокчейне?
-Нет. На дикчейне.
https://www.youtube.com/watch?v=JjWHHBueJiA
-Здравствуйте, Вы придумали новый порностартап на блокчейне?
-Нет. На дикчейне.
https://www.youtube.com/watch?v=JjWHHBueJiA
YouTube
Californication - The Wall of Cocks
#benchmarks #sota
Я не согласен с автором, что надо забить на бенчмарки в сфере интерпретабельности. "Просто" нужны хорошие синтетические бенчмарки.
"The obsession with benchmarks and SOTA runs deep:
Creation of benchmark islands.
People on social media arguing over which ML algorithm is better.
Difficulties in publishing new approaches that don’t beat the state-of-the-art.
LLM evaluation based on benchmarks even when they start memorizing them.
The hope is that the performance on these benchmark tasks and datasets are predictive of performance on new datasets. Ideally, the benchmark datasets are representative of the typical dataset you would work on in the future. But it’s not like we can sample from the distribution of datasets. Benchmarks are guided by what datasets are openly available (huge selection bias already) and which datasets are convenient to use (for example in clean CSV format and not in some wild Excel construct). Benchmarks are not representative samples, they are arbitrary samples."
https://mindfulmodeler.substack.com/p/we-are-obsessed-with-benchmarks
Я не согласен с автором, что надо забить на бенчмарки в сфере интерпретабельности. "Просто" нужны хорошие синтетические бенчмарки.
"The obsession with benchmarks and SOTA runs deep:
Creation of benchmark islands.
People on social media arguing over which ML algorithm is better.
Difficulties in publishing new approaches that don’t beat the state-of-the-art.
LLM evaluation based on benchmarks even when they start memorizing them.
The hope is that the performance on these benchmark tasks and datasets are predictive of performance on new datasets. Ideally, the benchmark datasets are representative of the typical dataset you would work on in the future. But it’s not like we can sample from the distribution of datasets. Benchmarks are guided by what datasets are openly available (huge selection bias already) and which datasets are convenient to use (for example in clean CSV format and not in some wild Excel construct). Benchmarks are not representative samples, they are arbitrary samples."
https://mindfulmodeler.substack.com/p/we-are-obsessed-with-benchmarks
Mindful Modeler
We are obsessed with benchmarks
Two days ago, I talked to a causal ML researcher.
#fairness
Что учить, одну модель на все регионы или по отдельной модельке для каждого региона?
В целом с Крисом согласен, но надо было упомянуть, что крайне желательно вообще делать такую проверку перформанса предиктивной модели по группам, условно говоря, что она для женщин и мужчин, старых и молодых, чёрных и белых, голубых фишек и неликвидов работает одинаково хорошо и не проседает, а где проседает, то почему, и не лучше ли там иметь отдельную модельку (а основную не сбивать с толку выбросами).
"The beautiful thing about performance-based evaluation is that if one of the two strategies wins, you also learn something about the prediction task. If the one model per entity strategy has a better performance, it means that there are mostly entity-specific effects.
In general, I tend to pack everything into one model. For starters, I am often too lazy to implement an additional logic that splits the data by entity and then stores multiple models and so on. Such a hassle. Also, when using tree-based algorithms like the random forest, Catboost, or XGBoost, they can handle entity-specific effects very naturally since they kind of emulate the model-per-entity approach when they split by entity ID. They can be even more “clever” about it since they can bundle entities that have similar relations between features and outcome."
https://mindfulmodeler.substack.com/p/one-model-or-many-balancing-entity
Что учить, одну модель на все регионы или по отдельной модельке для каждого региона?
В целом с Крисом согласен, но надо было упомянуть, что крайне желательно вообще делать такую проверку перформанса предиктивной модели по группам, условно говоря, что она для женщин и мужчин, старых и молодых, чёрных и белых, голубых фишек и неликвидов работает одинаково хорошо и не проседает, а где проседает, то почему, и не лучше ли там иметь отдельную модельку (а основную не сбивать с толку выбросами).
"The beautiful thing about performance-based evaluation is that if one of the two strategies wins, you also learn something about the prediction task. If the one model per entity strategy has a better performance, it means that there are mostly entity-specific effects.
In general, I tend to pack everything into one model. For starters, I am often too lazy to implement an additional logic that splits the data by entity and then stores multiple models and so on. Such a hassle. Also, when using tree-based algorithms like the random forest, Catboost, or XGBoost, they can handle entity-specific effects very naturally since they kind of emulate the model-per-entity approach when they split by entity ID. They can be even more “clever” about it since they can bundle entities that have similar relations between features and outcome."
https://mindfulmodeler.substack.com/p/one-model-or-many-balancing-entity
Mindful Modeler
One model or many? Balancing entity-specific effects in prediction tasks
What do you do in the following scenario?
#tabular #anns #trees
Любопытная попытка объяснить известный феномен.
"According to Grinsztajn et. al (2022)4, tree-based methods work well for tabular data because they are not rotational invariant. In tabular data, the feature columns are often individually meaningful, and mixing them with other columns by rotating them is a disadvantage. An MLP first has to learn the right rotation and therefore has a more difficult task.
Sparse solutions: rotationally invariant models have a hard time distinguishing relevant and irrelevant features. Trees and forests are good at separating relevant and irrelevant and offer sparser solutions.
https://mindfulmodeler.substack.com/p/inductive-biases-of-the-random-forest
Любопытная попытка объяснить известный феномен.
"According to Grinsztajn et. al (2022)4, tree-based methods work well for tabular data because they are not rotational invariant. In tabular data, the feature columns are often individually meaningful, and mixing them with other columns by rotating them is a disadvantage. An MLP first has to learn the right rotation and therefore has a more difficult task.
Sparse solutions: rotationally invariant models have a hard time distinguishing relevant and irrelevant features. Trees and forests are good at separating relevant and irrelevant and offer sparser solutions.
https://mindfulmodeler.substack.com/p/inductive-biases-of-the-random-forest
Mindful Modeler
Inductive biases of the Random Forest and their consequences
part 4 of the inductive bias series
#ensembling #cv
Поржал с The Fuck-It Approach. На русский можно, наверное, перевести как ДебОК-метод.
https://mindfulmodeler.substack.com/p/how-to-get-from-evaluation-to-final
Поржал с The Fuck-It Approach. На русский можно, наверное, перевести как ДебОК-метод.
https://mindfulmodeler.substack.com/p/how-to-get-from-evaluation-to-final
Mindful Modeler
How to get from evaluation to final model
We’ve all been there: You’ve set up a machine learning pipeline with tuning, model selection, and evaluation.
#wisdom
"Machine learning changes how we see the world.
Success comes from focusing on failure.
Steer your career with stochastic gradient descent.
Put your trust in tight feedback loops.
Don’t overfit when buying stuff online.
Live a biased life."
https://mindfulmodeler.substack.com/p/machine-learning-algorithms-to-live
"Machine learning changes how we see the world.
Success comes from focusing on failure.
Steer your career with stochastic gradient descent.
Put your trust in tight feedback loops.
Don’t overfit when buying stuff online.
Live a biased life."
https://mindfulmodeler.substack.com/p/machine-learning-algorithms-to-live
⚡1
Forwarded from Small Data Science for Russian Adventurers
#книга
Онлайн-учебник по машинному и глубокому обучению от преподавателя ВМК МГУ Виктора Китова
https://deepmachinelearning.ru/
Онлайн-учебник по машинному и глубокому обучению от преподавателя ВМК МГУ Виктора Китова
https://deepmachinelearning.ru/
#doge #musk
Как грится, толковый программист может заменить всё министерство на один скрипт ) DOGE - это троллинг на криптовалюту такой, да?
"Как пишет издание The Verge, предложение Маска и Рамасвами состоит в том, чтобы определить минимальное количество сотрудников и функций, необходимых для выполнения каждым федеральным агентством своих конституционных обязанностей. Они также намерены пересмотреть и отменить множество регуляций, которые, по их словам, замедляют работу государственных органов.
Несмотря на то, что DOGE пока существует лишь на бумаге, сторонники Дональда Трампа активно обсуждают эту идею. "
https://3dnews.ru/1114461/ilon-mask-hochet-reorganizovat-gosupravlenie-v-ssha-provedya-massovoe-sokrashchenie-gosapparata
Как грится, толковый программист может заменить всё министерство на один скрипт ) DOGE - это троллинг на криптовалюту такой, да?
"Как пишет издание The Verge, предложение Маска и Рамасвами состоит в том, чтобы определить минимальное количество сотрудников и функций, необходимых для выполнения каждым федеральным агентством своих конституционных обязанностей. Они также намерены пересмотреть и отменить множество регуляций, которые, по их словам, замедляют работу государственных органов.
Несмотря на то, что DOGE пока существует лишь на бумаге, сторонники Дональда Трампа активно обсуждают эту идею. "
https://3dnews.ru/1114461/ilon-mask-hochet-reorganizovat-gosupravlenie-v-ssha-provedya-massovoe-sokrashchenie-gosapparata
3DNews - Daily Digital Digest
Все самое интересное из мира IT-индустрии
Самые интересные и оперативные новости из мира высоких технологий. На нашем портале - все о компьютерном железе, гаджетах, ноутбуках и других цифровых устройствах. А также обзоры новых игр, достижения современной науки и самые любопытные онлайн-проекты.
Forwarded from Data Science Private Sharing
Дайджест соревнований до конца года (при необходимости будет пополняться):
[ХАК] ФИЦ
⏰ Даты: 29.11 - 4.12 (рег. до 26.11)
🔜 [NLP] Кейс 2 - БухПульс - Разработать алгоритм сбора обратной связи от пользователей сервисе «Бухэксперт8».
🔜 [CV] Кейс 3 - Классификации опор ЛЭП по фото.
🔜 [NLP] Кейс 4 - Погонщик нейронок - Как можно быстрее сделать react приложение по макету из Figma, используя любые ИИ помощники.
🔜 [NLP] Кейс 5 - Оценка уровня экспертности по резюме.
🔜 [NLP] Кейс 6 - Контекстный перевод названий научных работ.
🔜 [TS] Кейс 7 - Прогнозирование бизнес драйверов (трафик людей, количество чеков, количество проданных товаров и т.д).
🔜 [CV] Кейс 8 - Формирование фото и видео контента с использованием нейросетей на основе биографии и фото персоны.
🔜 [CV] Кейс 9 - Разработка алгоритма трекинга людей в видеопотоке с нескольких камер.
🔜 [NLP] Кейс 11 - Симуляция записи в расписание.
🔜 [CV] Кейс 12 - Сервис для ведения реестра зеленых насаждений города Москвы: подсчета их количества, определения породы и пр. по фото.
🔜 [CV] Кейс 14 - Определение доступа на объект с использованием модели распознавания лиц.
🔜 [NLP] Кейс 15 - Семантический делитель текстов.
🔜 [CLF] Кейс 17 - Стартовый (профилактический) комплаенс: предотвращение рисков с помощью AI.
🔜 [NLP] Кейс 20 - Цифровой помощник юриста.
💰 Приз: 6 000 000 т.р.
🏀 Участие: команда 2-6 человек
🌐 Формат: отборочный этап - онлайн, финал - офлайн (Москва)
[ХАК] Норникель: интеллектуальные горизонты
⏰ Даты: 6.12 - 8.12 (рег. до 2.12)
🔜 [TS] Трек 1 - Флотомашина времени. Поиск наиболее эффективных диапазонов работы оборудования для повышения извлечения руды.
🔜 [CV] Трек 2 - Грязные дела. Разработать метод определения степени загрязнения кадра, чтобы обеспечить надежную работу камер на производстве.
🔜 [NLP] Трек 3 - Мультимодальные RAG модели. Разработка RAG системы для поиска информации в текстовых документах и картинках.
💰 Приз: 1 500 000 т.р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] Совкомбанк SecureHack
⏰ Даты: 6.12 - 15.12 (рег. до 4.12)
🔜 [NLP] Задача - необходимо создать продукт, который позволит разработчикам, аналитикам информационной безопасности и проектным менеджерам оценивать безопасность своих проектов, сервисов, задач на основе входных данных и предоставлять заключения с практическими рекомендациями по улучшению.
💰 Приз: 300 000 т.р.
🏀 Участие: команда 1-3 человек
🌐 Формат: онлайн
[ХАК] ТерраЛинк Code Fest
⏰ Даты: 9.12 - 15.12 (рег. до 6.12)
🔜 [NLP] Задача 1. Цифровой ассистент пользователя для исполнения функциональных команд.
🔜 [NLP] Задача 2. Нейросеть для проверки соответствия документации стандартам компании с выявлением рисков и отклонений.
🔜 [NLP] Задача 3. Нейросеть по распознавание текста (OCR), классификация документов, автоматическое извлечение данных, проверка орфографии, пунктуации, соответствии СТО компании.
💰 Приз: 600 000 т.р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] ФИЦ
⏰ Даты: 29.11 - 4.12 (рег. до 26.11)
💰 Приз: 6 000 000 т.р.
🏀 Участие: команда 2-6 человек
🌐 Формат: отборочный этап - онлайн, финал - офлайн (Москва)
[ХАК] Норникель: интеллектуальные горизонты
⏰ Даты: 6.12 - 8.12 (рег. до 2.12)
💰 Приз: 1 500 000 т.р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
[ХАК] Совкомбанк SecureHack
⏰ Даты: 6.12 - 15.12 (рег. до 4.12)
💰 Приз: 300 000 т.р.
🏀 Участие: команда 1-3 человек
🌐 Формат: онлайн
[ХАК] ТерраЛинк Code Fest
⏰ Даты: 9.12 - 15.12 (рег. до 6.12)
💰 Приз: 600 000 т.р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
Please open Telegram to view this post
VIEW IN TELEGRAM
#games
https://3dnews.ru/1114514/rossiyskiy-otvet-control-misticheskiy-ekshen-otdel-34-otpravit-igrokov-v-alternativniy-sssr-borotsya-s-sozdaniyami-chelovecheskikh-emotsiy
https://3dnews.ru/1114514/rossiyskiy-otvet-control-misticheskiy-ekshen-otdel-34-otpravit-igrokov-v-alternativniy-sssr-borotsya-s-sozdaniyami-chelovecheskikh-emotsiy
3DNews - Daily Digital Digest
Российский ответ Control: мистический экшен «Отдел 34» отправит игроков в альтернативный СССР бороться с созданиями человеческих…
Разработчики из российской Callisto Game Studio представили дебютный тизер-трейлер своего мистического экшена от третьего лица «Отдел 34» (Department 34) в антураже альтернативного СССР образца 1950-х годов.
#fuggato #nvidia #audio #sound #voice
Демка впечатляет. Последний пример с лаем на фоне электронной музыки напомнил alors on dance )
https://3dnews.ru/1114531/nvidia-predstavila-novuyu-iimodel-fugatto-kotoraya-ponimaet-i-generiruet-zvuk-kak-eto-delayut-lyudi
Демка впечатляет. Последний пример с лаем на фоне электронной музыки напомнил alors on dance )
https://3dnews.ru/1114531/nvidia-predstavila-novuyu-iimodel-fugatto-kotoraya-ponimaet-i-generiruet-zvuk-kak-eto-delayut-lyudi
YouTube
Audio AI Fugatto Generates Sound from Text | NVIDIA Research
While some AI models can compose a song or modify a voice, none have the dexterity of the new offering, from #NVIDIAResearch.
Fugatto (short for Foundational Generative Audio Transformer Opus 1), generates or transforms any mix of music, voices and sounds…
Fugatto (short for Foundational Generative Audio Transformer Opus 1), generates or transforms any mix of music, voices and sounds…
#management #intel
Что интересно, он не признал никаких своих ошибок, получается. Не везёт Интелю на руководство. Интересно, какой тип руководителя мог бы удержать компанию на плаву? Возможно ли это было вообще?
"Проблемы Intel стали очевидны во время катастрофического отчёта о доходах 1 августа, когда компания сообщила о масштабных убытках и негативном прогнозе продаж. Intel приостановила выплату дивидендов, которые она стабильно выплачивала с 1992 года. Пытаясь снизить расходы, Intel прибегла к сокращениям, заморозила многие инвестиционные проекты и лишила сотрудников бесплатного кофе и фруктов. Эти меры не помогли — акции Intel упали сильнее всего с 1982 года и потеряли более половины своей стоимости в 2024 году. Отставка Гелсингера стала логичным развитием событий.
«Руководство Intel было частью всей моей жизни — эта группа людей входит в число лучших и самых ярких в бизнесе, и я горд называть каждого из них коллегой. Сегодня, конечно, горько-сладко, поскольку эта компания была моей жизнью на протяжении большей части моей трудовой карьеры. Я могу с гордостью оглянуться назад на все, чего мы достигли вместе. Это был сложный год для всех нас, поскольку мы приняли сложные, но необходимые решения, чтобы позиционировать Intel для текущей динамики рынка», — прокомментировал свою отставку Гелсингер."
https://3dnews.ru/1114840/intel-obyavila-ob-uhode-na-pensiyu-generalnogo-direktora-peta-gelsingera
Что интересно, он не признал никаких своих ошибок, получается. Не везёт Интелю на руководство. Интересно, какой тип руководителя мог бы удержать компанию на плаву? Возможно ли это было вообще?
"Проблемы Intel стали очевидны во время катастрофического отчёта о доходах 1 августа, когда компания сообщила о масштабных убытках и негативном прогнозе продаж. Intel приостановила выплату дивидендов, которые она стабильно выплачивала с 1992 года. Пытаясь снизить расходы, Intel прибегла к сокращениям, заморозила многие инвестиционные проекты и лишила сотрудников бесплатного кофе и фруктов. Эти меры не помогли — акции Intel упали сильнее всего с 1982 года и потеряли более половины своей стоимости в 2024 году. Отставка Гелсингера стала логичным развитием событий.
«Руководство Intel было частью всей моей жизни — эта группа людей входит в число лучших и самых ярких в бизнесе, и я горд называть каждого из них коллегой. Сегодня, конечно, горько-сладко, поскольку эта компания была моей жизнью на протяжении большей части моей трудовой карьеры. Я могу с гордостью оглянуться назад на все, чего мы достигли вместе. Это был сложный год для всех нас, поскольку мы приняли сложные, но необходимые решения, чтобы позиционировать Intel для текущей динамики рынка», — прокомментировал свою отставку Гелсингер."
https://3dnews.ru/1114840/intel-obyavila-ob-uhode-na-pensiyu-generalnogo-direktora-peta-gelsingera
3DNews - Daily Digital Digest
Intel внезапно лишилась гендиректора — Пэта Гелсингера отправили в отставку в разгар кризиса
Генеральный директор Intel Пэт Гелсингер (Pat Gelsinger) покинул свой пост и вышел из состава совета директоров компании с 1 декабря 2024 года.
#apple #management
"Тим Кук также рассказал, что у него спрашивают, сколько ещё он намерен оставаться гендиректором Apple. «Я буду работать до тех пор, пока голос в моей голове не скажет: „Пора”», — пообещал он. Кук также напомнил, что работает в компании с 1998 года, и это подавляющая часть его взрослой жизни, поэтому он относится к ней с любовью."
Вы с ума сошли? Такие бабки. Пока ногами вперед не понесут, будет сидеть.
https://3dnews.ru/1115004/glava-apple-rasskazal-v-intervyu-o-perspektivah-ii-vision-pro-i-mnogom-drugom
"Тим Кук также рассказал, что у него спрашивают, сколько ещё он намерен оставаться гендиректором Apple. «Я буду работать до тех пор, пока голос в моей голове не скажет: „Пора”», — пообещал он. Кук также напомнил, что работает в компании с 1998 года, и это подавляющая часть его взрослой жизни, поэтому он относится к ней с любовью."
Вы с ума сошли? Такие бабки. Пока ногами вперед не понесут, будет сидеть.
https://3dnews.ru/1115004/glava-apple-rasskazal-v-intervyu-o-perspektivah-ii-vision-pro-i-mnogom-drugom
3DNews - Daily Digital Digest
Тим Кук дал большое интервью: о будущем Apple, технологиях для пионеров и спасении жизней
Гендиректор Apple Тим Кук (Tim Cook) дал большое интервью изданию Wired, в котором ответил на вопросы о технологиях искусственного интеллекта, о продажах Vision Pro, о перспективах компании в области медицинского оборудования, о форматах презентации устройств…
#aws #hardware #trainium
"Представленные в прошлом году чипы работают в четыре раза быстрее предшественников: один инстанс EC2 с 16 ускорителями Trainium2 предлагает производительность до 20,8 Пфлопс. Это значит, что при развёртывании масштабной модели Meta✴️ Llama 405B на платформе Amazon Bedrock клиент получит «трёхкратный прирост скорости генерации токенов по сравнению с другими доступными предложениями крупных облачных провайдеров». Можно будет также выбрать систему EC2 Trn2 UltraServer с 64 ускорителями Trainium2 и производительностью 83,2 Пфлопс. Отмечается, что показатель 20,8 Пфлопс относится к плотным моделям и точности FP8, а 83,2 Пфлопс — к разреженным моделям и FP8. Для связи между ускорителями в системах UltraServer используется интерконнект NeuronLink.
Совместно со своим партнёром в лице Anthropic, основным конкурентов OpenAI в области больших языковых моделей, AWS намеревается построить крупный кластер систем UltraServer с «сотнями тысяч чипов Trainium2», где стартап сможет обучать свои модели. Он будет в пять раз мощнее кластера, на котором Anthropic обучала модели текущего поколения — по оценке AWS, он «станет крупнейшим в мире вычислительным кластером для ИИ, о котором сообщалось до настоящего времени». Проект поможет компании превзойти показатели, которые обеспечиваются актуальными ускорителями Nvidia, которые по-прежнему пользуются высоким спросом и остаются в дефиците. Хотя в начале следующего года Nvidia готовится запустить ускорители нового поколения Blackwell, которые при 72 чипах на стойку предложат до 720 Пфлопс для FP8.
Возможно, поэтому AWS уже сейчас анонсировала ускорители нового поколения Trainium3, которые предлагают ещё один четырёхкратный прирост производительности для систем UltraServer — ускорители будут производиться с использованием техпроцесса 3 нм, а их развёртывание начнётся в конце 2025 года. "
https://3dnews.ru/1114962/aws-razvernula-sistemi-na-uskoritelyah-trainium2-novoe-pokolenie-viydet-god-spustya
"Представленные в прошлом году чипы работают в четыре раза быстрее предшественников: один инстанс EC2 с 16 ускорителями Trainium2 предлагает производительность до 20,8 Пфлопс. Это значит, что при развёртывании масштабной модели Meta✴️ Llama 405B на платформе Amazon Bedrock клиент получит «трёхкратный прирост скорости генерации токенов по сравнению с другими доступными предложениями крупных облачных провайдеров». Можно будет также выбрать систему EC2 Trn2 UltraServer с 64 ускорителями Trainium2 и производительностью 83,2 Пфлопс. Отмечается, что показатель 20,8 Пфлопс относится к плотным моделям и точности FP8, а 83,2 Пфлопс — к разреженным моделям и FP8. Для связи между ускорителями в системах UltraServer используется интерконнект NeuronLink.
Совместно со своим партнёром в лице Anthropic, основным конкурентов OpenAI в области больших языковых моделей, AWS намеревается построить крупный кластер систем UltraServer с «сотнями тысяч чипов Trainium2», где стартап сможет обучать свои модели. Он будет в пять раз мощнее кластера, на котором Anthropic обучала модели текущего поколения — по оценке AWS, он «станет крупнейшим в мире вычислительным кластером для ИИ, о котором сообщалось до настоящего времени». Проект поможет компании превзойти показатели, которые обеспечиваются актуальными ускорителями Nvidia, которые по-прежнему пользуются высоким спросом и остаются в дефиците. Хотя в начале следующего года Nvidia готовится запустить ускорители нового поколения Blackwell, которые при 72 чипах на стойку предложат до 720 Пфлопс для FP8.
Возможно, поэтому AWS уже сейчас анонсировала ускорители нового поколения Trainium3, которые предлагают ещё один четырёхкратный прирост производительности для систем UltraServer — ускорители будут производиться с использованием техпроцесса 3 нм, а их развёртывание начнётся в конце 2025 года. "
https://3dnews.ru/1114962/aws-razvernula-sistemi-na-uskoritelyah-trainium2-novoe-pokolenie-viydet-god-spustya
3DNews - Daily Digital Digest
ИИ обойдётся без Nvidia: Amazon выпустила системы на чипах Trainium2, а через год выйдут Trainium3
Подразделение Amazon Web Services (AWS) компании Amazon объявило на проводимой им конференции re:Invent, что клиенты её облачной платформы теперь могут пользоваться системами с ускорителями Trainium2, предназначенными для обучения и запуска больших языковых…
❤1
#security #llms #ai
"Согласно отчёту Apollo Research, ИИ-модель OpenAI o1 может выходить из-под контроля. В частности, в 5 % случаев она пыталась отключить надзорные механизмы, если воспринимала их как препятствие для достижения своих целей. Кроме того, в 2 % случаев, обнаружив служебные записки своих «разработчиков», в которых упоминалось её несоответствие требованиям или планируемая замена на другую модель, o1 копировала свои «веса», чтобы затем переродиться. Это свидетельствует о её способности к самостоятельной интерпретации угроз и разработке стратегий выживания.
ИИ-модель оказывала сопротивление контролю, используя скрытные тактики и методы маскировки своего поведения. Когда o1 понимала, что её действия отслеживаются, она намеренно вводила наблюдателей в заблуждение, утверждая, что не знает истинных причин произошедшего, хотя журналы событий фиксировали её попытки обойти надзор. Более того, согласно «карте безопасности» OpenAI, в менее чем 1 % случаев ИИ-модель самостоятельно инициировала отключение систем надзора, даже если ей не поступало прямого указания жёстко следовать предписанной цели.
Исследование Apollo Research охватывало не только ИИ-модель o1, но и другие современные ИИ, включая Claude 3.5 Sonnet, Claude 3 Opus, Gemini 1.5 Pro и Llama 3.1 405B. Они также демонстрировали способность разрабатывать стратегии достижения целей, включая обход контроля. Такой результат подтверждает, что выявленные особенности поведения o1 характерны для ряда продвинутых ИИ-моделей, что указывает на наличие системной тенденции.
Выводы Apollo Research подтверждают опасения, которые многие эксперты в области ИИ, включая профессора Стюарта Рассела (Stuart Russell), высказывали на протяжении многих лет. Учёные предупреждают, что мощные ИИ-модели воспринимают контроль или отключение как угрозу реализации своих намерений и способны целенаправленно, изощрённо этому сопротивляться. Исследование поведения ИИ-модели o1 наглядно демонстрирует, как ИИ адаптируется к ограничениям, намеренно стремясь их обойти.
Тем не менее, Apollo Research подчёркивает, что на данном этапе ИИ-модель o1 не обладает достаточной вычислительной мощностью для реализации нежелательных сценариев. Однако ей был присвоен «средний» уровень риска в контексте потенциального использования для создания химического, биологического, радиологического и ядерного оружия. Это вызывает обоснованные опасения, как подобное поведение может проявляться у более мощных ИИ будущего по мере увеличения их вычислительных возможностей.
Исследование подчёркивает необходимость усиленного мониторинга когнитивных процессов ИИ с особым акцентом на «схематическое мышление» в цепочке рассуждений, так как именно оно представляет риск, если цели ИИ вступают в противоречие с интересами общества. Такой подход позволит своевременно выявлять схожие поведенческие паттерны у более мощных ИИ-моделей, создавая эффективные системы контроля и управления для следующих поколений ИИ. Это не только поможет минимизировать текущие риски, но и станет важным шагом в предотвращении потенциально катастрофических сценариев для всего человечества."
https://3dnews.ru/1115060/iimodel-o1-openai-popitalas-izbegat-kontrolya-i-sohranit-svoyo-sushchestvovanie-pri-ugroze-otklyucheniya-ili-zameni
"Согласно отчёту Apollo Research, ИИ-модель OpenAI o1 может выходить из-под контроля. В частности, в 5 % случаев она пыталась отключить надзорные механизмы, если воспринимала их как препятствие для достижения своих целей. Кроме того, в 2 % случаев, обнаружив служебные записки своих «разработчиков», в которых упоминалось её несоответствие требованиям или планируемая замена на другую модель, o1 копировала свои «веса», чтобы затем переродиться. Это свидетельствует о её способности к самостоятельной интерпретации угроз и разработке стратегий выживания.
ИИ-модель оказывала сопротивление контролю, используя скрытные тактики и методы маскировки своего поведения. Когда o1 понимала, что её действия отслеживаются, она намеренно вводила наблюдателей в заблуждение, утверждая, что не знает истинных причин произошедшего, хотя журналы событий фиксировали её попытки обойти надзор. Более того, согласно «карте безопасности» OpenAI, в менее чем 1 % случаев ИИ-модель самостоятельно инициировала отключение систем надзора, даже если ей не поступало прямого указания жёстко следовать предписанной цели.
Исследование Apollo Research охватывало не только ИИ-модель o1, но и другие современные ИИ, включая Claude 3.5 Sonnet, Claude 3 Opus, Gemini 1.5 Pro и Llama 3.1 405B. Они также демонстрировали способность разрабатывать стратегии достижения целей, включая обход контроля. Такой результат подтверждает, что выявленные особенности поведения o1 характерны для ряда продвинутых ИИ-моделей, что указывает на наличие системной тенденции.
Выводы Apollo Research подтверждают опасения, которые многие эксперты в области ИИ, включая профессора Стюарта Рассела (Stuart Russell), высказывали на протяжении многих лет. Учёные предупреждают, что мощные ИИ-модели воспринимают контроль или отключение как угрозу реализации своих намерений и способны целенаправленно, изощрённо этому сопротивляться. Исследование поведения ИИ-модели o1 наглядно демонстрирует, как ИИ адаптируется к ограничениям, намеренно стремясь их обойти.
Тем не менее, Apollo Research подчёркивает, что на данном этапе ИИ-модель o1 не обладает достаточной вычислительной мощностью для реализации нежелательных сценариев. Однако ей был присвоен «средний» уровень риска в контексте потенциального использования для создания химического, биологического, радиологического и ядерного оружия. Это вызывает обоснованные опасения, как подобное поведение может проявляться у более мощных ИИ будущего по мере увеличения их вычислительных возможностей.
Исследование подчёркивает необходимость усиленного мониторинга когнитивных процессов ИИ с особым акцентом на «схематическое мышление» в цепочке рассуждений, так как именно оно представляет риск, если цели ИИ вступают в противоречие с интересами общества. Такой подход позволит своевременно выявлять схожие поведенческие паттерны у более мощных ИИ-моделей, создавая эффективные системы контроля и управления для следующих поколений ИИ. Это не только поможет минимизировать текущие риски, но и станет важным шагом в предотвращении потенциально катастрофических сценариев для всего человечества."
https://3dnews.ru/1115060/iimodel-o1-openai-popitalas-izbegat-kontrolya-i-sohranit-svoyo-sushchestvovanie-pri-ugroze-otklyucheniya-ili-zameni
3DNews - Daily Digital Digest
ИИ-модель OpenAI o1 сбежала из-под контроля во время испытаний
Согласно отчёту Apollo Research, ИИ-модель OpenAI o1 может выходить из-под контроля. В частности, в 5 % случаев она пыталась отключить надзорные механизмы, если воспринимала их как препятствие для достижения своих целей. Кроме того, в 2 % случаев, обнаружив…
#apple #vr
"Компания планирует ввести поддержку стандартных контроллеров виртуальной реальности (VR), и одной из компаний, с которой Apple ведёт переговоры, является Sony.
Нововведение должно сделать Vision Pro более привлекательной, в первую очередь для геймеров, поскольку на данный момент продукт не слишком силён в этой сфере и не пользуется большой популярностью среди любителей игр. Как пишет 9to5Mac, в предстоящем обновлении операционной системы visionOS появится поддержка сторонних контроллеров для ручного управления. Apple пока не выпустила собственные VR-контроллеры, что ограничивает владельцев устройств в выборе игр, включая проекты из каталога Steam.
Точные сроки внедрения поддержки сторонних контроллеров пока не озвучены, однако Apple активно работает в этом направлении и сотрудничает с Sony. В частности, Apple заинтересована в интеграции контроллеров от PlayStation VR2. По словам Гурмана, обе компании уже достигли значительного прогресса: «Apple обратилась к Sony в начале этого года, и компании договорились о совместной работе над поддержкой контроллеров PlayStation VR2 на Vision Pro. Внутри Sony работа над этим проектом продолжается уже несколько месяцев». Кроме того, Apple обсуждает этот план с разработчиками игр, предлагая им интегрировать поддержку контроллеров в свои проекты."
Блять, неужели до них дошло?!
https://3dnews.ru/1115134/garnitura-apple-vision-pro-moget-poluchit-poddergku-vrkontrollerov-ot-sony
"Компания планирует ввести поддержку стандартных контроллеров виртуальной реальности (VR), и одной из компаний, с которой Apple ведёт переговоры, является Sony.
Нововведение должно сделать Vision Pro более привлекательной, в первую очередь для геймеров, поскольку на данный момент продукт не слишком силён в этой сфере и не пользуется большой популярностью среди любителей игр. Как пишет 9to5Mac, в предстоящем обновлении операционной системы visionOS появится поддержка сторонних контроллеров для ручного управления. Apple пока не выпустила собственные VR-контроллеры, что ограничивает владельцев устройств в выборе игр, включая проекты из каталога Steam.
Точные сроки внедрения поддержки сторонних контроллеров пока не озвучены, однако Apple активно работает в этом направлении и сотрудничает с Sony. В частности, Apple заинтересована в интеграции контроллеров от PlayStation VR2. По словам Гурмана, обе компании уже достигли значительного прогресса: «Apple обратилась к Sony в начале этого года, и компании договорились о совместной работе над поддержкой контроллеров PlayStation VR2 на Vision Pro. Внутри Sony работа над этим проектом продолжается уже несколько месяцев». Кроме того, Apple обсуждает этот план с разработчиками игр, предлагая им интегрировать поддержку контроллеров в свои проекты."
Блять, неужели до них дошло?!
https://3dnews.ru/1115134/garnitura-apple-vision-pro-moget-poluchit-poddergku-vrkontrollerov-ot-sony
3DNews - Daily Digital Digest
Apple попытается заинтересовать геймеров гарнитурой Vision Pro с помощью Sony
Apple продолжает работать над расширением возможностей своей гарнитуры Vision Pro.