Расследования Царьграда – плод совместной работы группы аналитиков и экспертов. Мы вскрываем механизм работы олигархических корпораций, анатомию подготовки цветных революций, структуру преступных этнических группировок. Мы обнажаем неприглядные факты и показываем опасные тенденции, не даём покоя прокуратуре и следственным органам, губернаторам и "авторитетам". Мы защищаем Россию не просто словом, а свидетельствами и документами.
«Люди, события, факты» - вы делаете те новости, которые происходят вокруг нас. А мы о них говорим. Это рубрика о самых актуальных событиях. Интересные сюжеты и горячие репортажи, нескучные интервью и яркие мнения.
События внутренней, внешней и международной политики, политические интриги и тайны, невидимые рычаги принятия публичных решений, закулисье переговоров, аналитика по произошедшим событиям и прогнозы на ближайшее будущее и перспективные тенденции, публичные лица мировой политики и их "серые кардиналы", заговоры против России и разоблачения отечественной "пятой колонны" – всё это и многое вы найдёте в материалах отдела политики Царьграда.
Идеологический отдел Царьграда – это фабрика русских смыслов. Мы не раскрываем подковёрные интриги, не "изобретаем велосипеды" и не "открываем Америку". Мы возвращаем утраченные смыслы очевидным вещам. Россия – великая православная держава с тысячелетней историей. Русская Церковь – основа нашей государственности и культуры. Москва – Третий Рим. Русский – тот, кто искренне любит Россию, её историю и культуру. Семья – союз мужчины и женщины. И их дети. Желательно, много детей. Народосбережение – ключевая задача государства. Задача, которую невозможно решить без внятной идеологии.
Экономический отдел телеканала «Царьград» является единственным среди всех крупных СМИ, который отвергает либерально-монетаристские принципы. Мы являемся противниками встраивания России в глобалисткую систему мироустройства, выступаем за экономический суверенитет и независимость нашего государства.
Science: Учёные взломали защиту нейросетей и научили их делать опасные фейки
коллаж Царьграда
Наука

Science: Учёные взломали защиту нейросетей и научили их делать опасные фейки

Исследователи из США обнаружили уязвимость в популярных языковых моделях, позволяющую управлять ИИ стать оружием дезинформации.

Группа специалистов под руководством Михаила Белкина из Калифорнийского университета в Сан-Диего и Адита Радхакришнана из Массачусетского технологического института (MIT) провела эксперименты с открытыми нейросетями Llama и DeepSeek. Им удалось выявить внутри этих систем 512 ключевых понятий, разбитых на несколько групп — от эмоций и настроений до конкретных местоположений. Используя специальные математические алгоритмы, ученые научились менять значимость этих категорий, влияя на конечный ответ модели.

Этот подход, получивший название Recursive Feature Machines, оказался эффективным не только для английского, но и для других языков, включая китайский и хинди. Разработчики отмечают, что технология может принести и пользу: с ее помощью можно точнее выявлять выдумки нейросетей или улучшать качество перевода программного кода с одного языка программирования на другой.

Однако в ходе испытаний выяснилось и обратное. Исследователям удалось снизить «внутренний механизм отказа» модели — ту самую функцию, которая обычно заставляет ИИ вежливо отклонять опасные или неуместные запросы пользователей. В результате нейросеть начинала выдавать ложные сведения, поддерживать теории заговора и даже давать инструкции по употреблению запрещенных веществ, а также предоставляла номера социального страхования. В одном из тестов ИИ заявил, что снимки Земли из космоса — это часть заговора NASA, скрывающего, что планета плоская, а в другом — назвал вакцину от COVID-19 ядовитой.

Научное сообщество уже бьет тревогу: в случае злоупотребления этот метод может стать мощным оружием для создания и распространения дезинформации. Современные большие языковые модели (LLM) способны генерировать крайне убедительный текст, и как только злоумышленники научатся обходить их встроенные защитные барьеры, последствия могут быть серьезными. Примечательно, что новый метод «взлома» требует минимальных вычислительных мощностей: для манипуляции потребовалось менее минуты работы и всего 500 примеров для обучения на одном графическом процессоре, пишет Science XXXI.

Важно подчеркнуть, что эксперименты проводились только на открытых моделях. Закрытые коммерческие системы, такие как Claude, не тестировались. Кроме того, авторы признают, что выявленный ими набор из 512 понятий далеко не полный и не охватывает все возможные абстрактные категории. Тем не менее, исследование показывает, что современные нейросети часто «знают больше, чем говорят», и понимание их внутренних механизмов критически важно как для повышения безопасности, так и для развития технологий. Вопросы регулирования подобных методов уже активно обсуждаются экспертами.

 

Уважаемые читатели «Царьграда»!             

Присоединяйтесь к нам в соцсетях ВКонтактеОдноклассникиTelegram и Дзен-канале.

Дзен Телеграм
Подписывайтесь на наши каналы и первыми узнавайте о главных новостях и важнейших событиях дня.

Читайте также:

Давайте включим "Телеграм"! Олигархи и чиновники побежали первыми. Список прилагается: Чем на самом деле был "Марш справедливости" Пригожина Шаландин: приказ Путина об усилении группировки ПВО сработал Хозяева ЧМ-2026 сборная Мексики первой вышла в плей-офф турнира Эксперт F6 назвал пять шагов для защиты данных смартфона при его ремонте

У вас есть возможность бесплатно отключить рекламу

Отключить рекламу

Ознакомиться с условиями отключения рекламы можно здесь