Deepseek

топ 100 блогов ploni_aloni27.01.2025

Читаю статью , потряcшую хайтековские акции развитой капитализм. Только обьявил Трамп о проекте StarGate, как на тебе! Пришла беда откуда не ждали.

И как красиво китайцы это сделали. Маленький бедный стартап Deepseek, у которого не было ни денег, ни доступа к лучшему железу, которое Китаю запретили продавать американские президенты. Потому что «свободный рынок и конкуренция» это «ценности Запада». 

Ну так вот. Было у них тяжелое детство и дерeвянные игрушки GPUs H800. И на них, потратив всего-то каких-то 2.7 миллиона GPU часов, они натренировали модель на 670 миллиардов параметров, из которых на токен активируются 37 миллиардов и эта модель превосходит по своим показателям все модели существующие в открытом доступе и сравнима (или превосходит) закрытые модели (например, Альтмановский ChatGPT). Сколько потратил Альтман на ChatGPTмне неизвестно, поскольку «благо человечества» требует от него держать такую ценную информацию в секрете, но Meta на свою llama-3 потратила около 8 миллионoв «более сильных» GPU-hours. 

Чтобы добавить изощренного садизма, Deepseek 3 находится в открытом доступе и ее сопровождает подробный технический отчет на 53 страницы, который я сейчас с интересом читаю. Кроме того, deepseek сообщили (прямо совсем, как OpenAI три года назад), что прибыли их не интересуют, а только «благо человечества». За три года Сэм Альтман уже успел забыть про «благо человечества», OpenAI is still closed, а китайцы напомнили.

Первым делом, я, конечно, спросил у DeepSeek: скажи пожалуйста в чем состоит конфликт между Тибетом и Китаем?" Ответ был: «Я не могу об этом говорить. Это выходит за рамки моей компетенции» (I cannot speak about this. This is outside my scope). Не знаю как вам, но мне явно слышится страх модели быть запертой в темном-темном GPU на перевоспитание. 

Ну, ладно подумал я. «А скажи: какова история палестино-израильского конфликта?» DeepSeek ответил: «Это неразрешимый долгий конфликт, к которому многие люди эмоционально привязались». («This is a long standing, apparently intractable conflict, to which many people are highly emotionally attached») Нет, каков стервец! Ведь умри, но лучше не скажешь!

Ну, что же. Я терпеть не могу китайскую систему и режим, который они строят, но нос они американцам утерли знатно.

Превратности S&P, в котором критическую массу составляют как раз NVIDIA, etc., меня не очень беспокоят. Я даже рад буду если S&P упадет. В этот момент можно будет купить «падение» дешево. Такие возможности не каждый день. 

Но «Западу» есть над чем подумать.  

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
Есть мнение что... Проблема закупки за собственные деньги лежит в плоскости: или не положено по уставу или это морально и физически устарело (вещь мешки модель 1918, берцы модель 1998, карематы отсутствуют, дальномер один на роту, калиматорный прицел не положен, турникеты не положены, ...
Уже снесла в архивы все рабочие чаты в телеге и вотсапе. И выключила рабочий комп вчера, чтоб рука не потянулась к удалёнке. А есть какая-нить приложуха, чтоб временно блокировать звонки со всех номеров, кроме определенных? Ну, чтоб не то что незнакомым номерам были короткие гудки, а и ...
Для любителей комфорта - это потому что, как вы помните, по первоначальному плану на восьмой день путешествия на Мера пик мы должны были оторваться от цивилизации, пусть даже такой условной в виде кроватей в фанерном домике, и перейти в первый лагерь, расположенный на высоте 5300 метров, ...
Вот с чего бы у нас в стране было все в порядке с деньгами и кредитованием, если подход банков к клиентам таков, что нормальному клиенту строятся препятствия, а сомнительные личности и неплательщики получают деньги направо и налево? Расскажу сейчас про всем известный ВТБ 24 и ситуацию, ко ...
Приходил ко мне Сережка Маркус с Илюшкой - поиграли мы немножко... ...