Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Sakana AI представили Sudoku-Bench - набор классических и продвинутых судоку-задач, который проверяет не память модели, а её способность рассуждать, понимать новые правила и держать всю логику пазла в голове.
Они протестировали современные модели, включая GPT-5 и методы тонкой настройки вроде GRPO и thought-cloning.
Главное:
GPT-5 стала первой моделью, которая уверенно решает часть сложных задач и показала около 33 % успешных решений на наборе challenge_100. Ранее ни одна LLM не справлялась даже с обычным 9×9.
Но треть решённых - это всё ещё мало: большая часть задач остаётся нерешённой, особенно варианты с необычными правилами.
Ключевая трудность в том, что такие головоломки требуют не просто следовать правилам, а уметь понять незнакомые ограничения, найти стратегию «входа», просчитывать ходы вперёд и сохранять глобальную согласованность. Модели часто делают правильные локальные шаги, но теряют общую структуру.
GRPO и thought-cloning дают улучшения, но пока не позволяют моделям преодолеть сложные варианты. Даже с обучением на человеческих примерах ИИ быстро «запутывается» в длинных логических цепочках.
Sudoku-Bench - это тест на реальное рассуждение, а не на подбор паттернов. Он проверяет пространственное мышление, логику, способность адаптироваться и работать с новыми правилами. Прогресс на таких задачах - показатель движения к более структурному и осмысленному ИИ.
Авторы предлагают Sudoku-Bench как стандарт, по которому можно судить, насколько модели действительно умеют думать. Для будущих систем важны не просто большие параметры, а развитая логика, планирование и умение работать с новыми структурами задач.
@ai_machinelearning_big_data
#ai #ml #sakana
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1
Северокорейские хакеры удаленно стирают содержимое устройств под управлением мобильной операционной системы Android.
По сообщению Bleeping Computer, делается это при помощи легитимного сервиса «Портал поиска» корпорации Google, разработчика Android (AOSP). Жертвами новой кампании в основном становятся жители Южной Кореи, по тем или иным причинам попавшие в поле интереса хакеров.
В инструментарии злоумышленников – метод целевого фишинга. На контакт с жертвой хакеры выходят посредством популярного в Южной Корее мессенджера KakaoTalk, разработкой которого занимается местная Kakao Corporation.
Специалисты по кибербезопасности из компании Genians связывают новую кампанию с северокорейскими группировками APT37 (ScarCruft) и Kimsuky (Emerald Sleet), использующие инструмент удаленного доступа Konni.
По сообщению Bleeping Computer, делается это при помощи легитимного сервиса «Портал поиска» корпорации Google, разработчика Android (AOSP). Жертвами новой кампании в основном становятся жители Южной Кореи, по тем или иным причинам попавшие в поле интереса хакеров.
В инструментарии злоумышленников – метод целевого фишинга. На контакт с жертвой хакеры выходят посредством популярного в Южной Корее мессенджера KakaoTalk, разработкой которого занимается местная Kakao Corporation.
Специалисты по кибербезопасности из компании Genians связывают новую кампанию с северокорейскими группировками APT37 (ScarCruft) и Kimsuky (Emerald Sleet), использующие инструмент удаленного доступа Konni.
Forwarded from Игнатий Цукергохер
Вчера вечером интернет вместе с отключением связи и заморозкой сим-карт заполонило видео с падающим роботом от Новой Технологической Коалиции. Каждый знаток робототехники из комментариев начал ныть, что в Рашке всё херово, представили какой-то аналагавнет, робот на презентации обосрался и прочие негативные мысли.
С дипломом робототехника и с опытом продвижения российского импортозамещения мне вдвойне обидно. Вчера хотел написать, что всё сложнее, чем просто "робот упал ахахах" и "российские разработчики опять не смогли". Дело в 10 годах пропаганды "всё купим, зачем производство", развале отраслей, кроме торговли, в 90-е и восстановлении их из откровенного барахла последние 15 лет, проблемах частных компаний, которые проснулись только после 2022, а не после 2014. Доля вины компаний есть: проще было закупать китайское, чем делать своё. Сейчас это меньше, а у многих китаеперекупов 2014-го уже локализованные линии и многое другое.
И то, что новый робот, даже с падением, — небольшой, но прорыв, особенно с локализацией в 77%, — игнорируется комментаторами. Важно, как в игре, докачаться до нужного уровня, и вот — роботы сами ходят, говорят и ура. Кстати, в новостях я не заметил ссылок-сравнений с Цукербергом и проё..долбом его компании с умными очками. Денег у них больше, разработчиков больше, но почему про это никто не вспомнил, или почти не вспомнил.
Мы запросили у разработчиков новое видео из лаборатории — они прислали. По видео видно, что робота тестировали и он проходил испытания. Да, ходит неуверенно, но аналоги ходят примерно так же.
Посмотрим, что будет дальше. Сейчас, учитывая обстоятельства и имеющиеся у меня данные, считаю, что катастрофы не случилось.
#робототехника #Игнатий_вещает #Игнатий_сентябрь
💬 Участвуйте в новом розыгрыше!
| Telegram | VK | Сайт | Милостыня |
С дипломом робототехника и с опытом продвижения российского импортозамещения мне вдвойне обидно. Вчера хотел написать, что всё сложнее, чем просто "робот упал ахахах" и "российские разработчики опять не смогли". Дело в 10 годах пропаганды "всё купим, зачем производство", развале отраслей, кроме торговли, в 90-е и восстановлении их из откровенного барахла последние 15 лет, проблемах частных компаний, которые проснулись только после 2022, а не после 2014. Доля вины компаний есть: проще было закупать китайское, чем делать своё. Сейчас это меньше, а у многих китаеперекупов 2014-го уже локализованные линии и многое другое.
И то, что новый робот, даже с падением, — небольшой, но прорыв, особенно с локализацией в 77%, — игнорируется комментаторами. Важно, как в игре, докачаться до нужного уровня, и вот — роботы сами ходят, говорят и ура. Кстати, в новостях я не заметил ссылок-сравнений с Цукербергом и проё..долбом его компании с умными очками. Денег у них больше, разработчиков больше, но почему про это никто не вспомнил, или почти не вспомнил.
Мы запросили у разработчиков новое видео из лаборатории — они прислали. По видео видно, что робота тестировали и он проходил испытания. Да, ходит неуверенно, но аналоги ходят примерно так же.
Посмотрим, что будет дальше. Сейчас, учитывая обстоятельства и имеющиеся у меня данные, считаю, что катастрофы не случилось.
#робототехника #Игнатий_вещает #Игнатий_сентябрь
| Telegram | VK | Сайт | Милостыня |
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
SanDisk повысила контрактные цены на флэш-память NAND на внушительные 50%
С увеличением стоимости NAND-памяти пользователи ПК могут ожидать повышения цен на SSD, ноутбуки и другие компьютерные устройства. Как утверждается, корректировка цен на продукцию SanDisk вызвала цепную реакцию в индустрии. Производители, такие как Apacer, Transcent и Innodisk, приостановили ценообразование и приостановили поставки. Эти компании ожидают дальнейшего роста цен.
За последний месяц цена акций SanDisk увеличилась более чем на 100%. Спрос на память всех типов значительно вырос из-за растущего интереса к центрам обработки данных для искусственного интеллекта, который поглощает все доступные модули памяти на рынке полупроводников. Этот фактор привел к дефициту и, как следствие, росту цен.
С увеличением стоимости NAND-памяти пользователи ПК могут ожидать повышения цен на SSD, ноутбуки и другие компьютерные устройства. Как утверждается, корректировка цен на продукцию SanDisk вызвала цепную реакцию в индустрии. Производители, такие как Apacer, Transcent и Innodisk, приостановили ценообразование и приостановили поставки. Эти компании ожидают дальнейшего роста цен.
За последний месяц цена акций SanDisk увеличилась более чем на 100%. Спрос на память всех типов значительно вырос из-за растущего интереса к центрам обработки данных для искусственного интеллекта, который поглощает все доступные модули памяти на рынке полупроводников. Этот фактор привел к дефициту и, как следствие, росту цен.
Череповецкий городской суд обязал фанерно-мебельный комбинат восстановить на работе экономиста, уволенного за игру в World of Tanks в рабочее время. С предприятия также взыскали свыше 580 тысяч рублей в качестве компенсации за моральный вред и вынужденный прогул. Увольнение произошло весной 2024 года после двух выговоров за «использование корпоративной сети в личных целях». Суд в ходе разбирательства установил, что приказы об увольнении и взысканиях были оформлены задним числом, а трудовым договором не предусмотренно запрета на компьютерные игры. Виктор проработал экономистом на комбинате более 20 лет без единого замечания и пользовался уважением коллег. По его словам, он запускал игру исключительно в перерывах и подключался через личный мобильный интернет, не затрагивая корпоративную сеть. Иск работника удовлетворен в полном объеме: все дисциплинарные меры отменены, Виктор возвращен на прежнюю должность, а комбинат обязан выплатить ему зарплату за весь период простоя плюс компенсацию морального ущерба.
Forwarded from VK Play
Императорский фарфоровый завод представил коллекцию по мотивам Atomic Heart!
Каждая фигурка — уникальна и сделана вручную. Цена: 169 тыс. рублей.
На мероприятии была Анита Пудикова, балерина — прообраз Близняшек.
😊 Подписывайтесь на VK Play
Каждая фигурка — уникальна и сделана вручную. Цена: 169 тыс. рублей.
На мероприятии была Анита Пудикова, балерина — прообраз Близняшек.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤯1😱1
Forwarded from Волкова (Кирбирева) Катерина
КАК О НАС ГОВОРЯТ МИРОВЫЕ СМИ
1 Китай
«Предлагаем познакомиться с первым российским антропоморфным роботом с искусственным интеллектом — это Aidol! Он может общаться с людьми, выражать эмоции, передвигаться на ногах, манипулировать предметами и работать полностью офлайн, рассказали разработчики. Презентация проекта Новой технологической коалиции состоялась в Москве.»
2 США
«Первый российский гуманоидный робот с искусственным интеллектом, AIdol, упал лицом вниз на сцене всего через несколько секунд после начала презентации на технологическом мероприятии в Москве во вторник, рухнув на пол после попытки помахать аудитории под музыкальную тему из фильма «Рокки».»
1 Китай
«Предлагаем познакомиться с первым российским антропоморфным роботом с искусственным интеллектом — это Aidol! Он может общаться с людьми, выражать эмоции, передвигаться на ногах, манипулировать предметами и работать полностью офлайн, рассказали разработчики. Презентация проекта Новой технологической коалиции состоялась в Москве.»
2 США
«Первый российский гуманоидный робот с искусственным интеллектом, AIdol, упал лицом вниз на сцене всего через несколько секунд после начала презентации на технологическом мероприятии в Москве во вторник, рухнув на пол после попытки помахать аудитории под музыкальную тему из фильма «Рокки».»
Индустрия здоровья Сбера и НМИЦ им. В. А. Алмазова представили модель ИИ «Сердце» для оценки состояния коронарных сосудов: она анализирует коронарограммы в DICOM, находит сужения и закупорки, а также рассчитывает Syntax Score. По данным Сбера, точность составляет 94,74 %. Решение помогает выбирать тактику лечения — операцию или стентирование. Модель обучили на тысячах снимков из НМИЦ им. В. А. Алмазова и Тюменского кардиологического научного центра.
То есть, у нас теперь ИИ будет ставить диагнозы? Тогда чем это будет отличаться от поисковой выдачи, где по запросу "Боль в груди" тебе выдаётся "Рак головного мозга"?
С другой стороны, если это поможет лучше анализировать состояние пациента - плюсов от этого больше.
То есть, у нас теперь ИИ будет ставить диагнозы? Тогда чем это будет отличаться от поисковой выдачи, где по запросу "Боль в груди" тебе выдаётся "Рак головного мозга"?
С другой стороны, если это поможет лучше анализировать состояние пациента - плюсов от этого больше.
Samsung делает Flip8 гораздо тоньше: в сложенном виде ожидается 9,8 мм — около 30% меньше, чем у Flip7 (13,7 мм). Внутренний экран сохранит 6,9 дюйма, внешний, вероятно, без серьёзных изменений. Для ориентира: Motorola Razr 60 Ultra — 7,2 мм в разложенном, то есть новый Samsung в сложенном будет толще лишь примерно на треть (на 2,6 мм). Раньше по-настоящему тонким стал прежде всего Galaxy Z Fold7. В следующем году Motorola может выпустить ещё более тонкий аппарат.
А что - телефоны "раскладушки" снова в моде? Мне казалось, с ними кучу проблем, как в плане ремонтопригодности, так и удобства
А что - телефоны "раскладушки" снова в моде? Мне казалось, с ними кучу проблем, как в плане ремонтопригодности, так и удобства
Forwarded from Управление Уязвимостями и прочее
В либеральных ТГ-каналах по ИБ понесли мессадж, что ограничения продажи и использования SIM-карт (в т.ч. приостановка их работы после выезда из страны) - это якобы очень плохо для экономики. Видимо, по мнению авторов, в России должно быть как в жарких микро-странах с all-inclusive отелями: без каких-либо документов покупаешь в ларьке симку за 10 баксов и пользуешься. 🤠
Вот только мы (сюрприз!) живём не в стране-курорте, а в региональной сверхдержаве, более трёх лет находящейся в состоянии масштабного военного конфликта со всем западным миром. 🤷♂️ Поэтому если наши военные специалисты считают, что такие меры
🔹 увеличат стоимость вражеских беспилотных атак, в которых погибнет меньше россиян;
🔹 усилят контроль за коммуникациями и, как следствие, будет меньше Крокусов;
значит эти меры абсолютно оправданы.
И если гражданам (и тем более дорогим иностранным гостям 😏) придётся сделать несколько бюрократических приседаний для получения российской SIM-карты, пусть будет так. 😇
@avleonovrus #sim #phone
Вот только мы (сюрприз!) живём не в стране-курорте, а в региональной сверхдержаве, более трёх лет находящейся в состоянии масштабного военного конфликта со всем западным миром. 🤷♂️ Поэтому если наши военные специалисты считают, что такие меры
🔹 увеличат стоимость вражеских беспилотных атак, в которых погибнет меньше россиян;
🔹 усилят контроль за коммуникациями и, как следствие, будет меньше Крокусов;
значит эти меры абсолютно оправданы.
И если гражданам (и тем более дорогим иностранным гостям 😏) придётся сделать несколько бюрократических приседаний для получения российской SIM-карты, пусть будет так. 😇
@avleonovrus #sim #phone
Forwarded from VK Play
Media is too big
VIEW IN TELEGRAM
«Плюс Студия» представила первый геймплейный тизер-трейлер игры «Киберслав: Затмение»!
😊 Подписывайтесь на VK Play
Please open Telegram to view this post
VIEW IN TELEGRAM
VK Play
«Плюс Студия» представила первый геймплейный тизер-трейлер игры «Киберслав: Затмение»! 😊 Подписывайтесь на VK Play
Не знаю как вам , но по мне это АХУЕННО
Жаль только, что само аниме пока так и не вышло
Жаль только, что само аниме пока так и не вышло