Deepseek

топ 100 блогов ploni_aloni27.01.2025

Читаю статью , потряcшую хайтековские акции развитой капитализм. Только обьявил Трамп о проекте StarGate, как на тебе! Пришла беда откуда не ждали.

И как красиво китайцы это сделали. Маленький бедный стартап Deepseek, у которого не было ни денег, ни доступа к лучшему железу, которое Китаю запретили продавать американские президенты. Потому что «свободный рынок и конкуренция» это «ценности Запада». 

Ну так вот. Было у них тяжелое детство и дерeвянные игрушки GPUs H800. И на них, потратив всего-то каких-то 2.7 миллиона GPU часов, они натренировали модель на 670 миллиардов параметров, из которых на токен активируются 37 миллиардов и эта модель превосходит по своим показателям все модели существующие в открытом доступе и сравнима (или превосходит) закрытые модели (например, Альтмановский ChatGPT). Сколько потратил Альтман на ChatGPTмне неизвестно, поскольку «благо человечества» требует от него держать такую ценную информацию в секрете, но Meta на свою llama-3 потратила около 8 миллионoв «более сильных» GPU-hours. 

Чтобы добавить изощренного садизма, Deepseek 3 находится в открытом доступе и ее сопровождает подробный технический отчет на 53 страницы, который я сейчас с интересом читаю. Кроме того, deepseek сообщили (прямо совсем, как OpenAI три года назад), что прибыли их не интересуют, а только «благо человечества». За три года Сэм Альтман уже успел забыть про «благо человечества», OpenAI is still closed, а китайцы напомнили.

Первым делом, я, конечно, спросил у DeepSeek: скажи пожалуйста в чем состоит конфликт между Тибетом и Китаем?" Ответ был: «Я не могу об этом говорить. Это выходит за рамки моей компетенции» (I cannot speak about this. This is outside my scope). Не знаю как вам, но мне явно слышится страх модели быть запертой в темном-темном GPU на перевоспитание. 

Ну, ладно подумал я. «А скажи: какова история палестино-израильского конфликта?» DeepSeek ответил: «Это неразрешимый долгий конфликт, к которому многие люди эмоционально привязались». («This is a long standing, apparently intractable conflict, to which many people are highly emotionally attached») Нет, каков стервец! Ведь умри, но лучше не скажешь!

Ну, что же. Я терпеть не могу китайскую систему и режим, который они строят, но нос они американцам утерли знатно.

Превратности S&P, в котором критическую массу составляют как раз NVIDIA, etc., меня не очень беспокоят. Я даже рад буду если S&P упадет. В этот момент можно будет купить «падение» дешево. Такие возможности не каждый день. 

Но «Западу» есть над чем подумать.  

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
Вечером в четверг прихожу домой и вижу картину маслом - деточка моя средняя возлегает в танцевальных одежках со страдальческим лицом на нашей кровати в спальне. До этого она принесла две двойки по литературе, отлично зная материал (стесняться изволила), и трояк по английскому - запомнить ...
きっと一生, 全盛期 – Вечно в самом расцвете. Бывшая участница AKB48 великолепная Харуна Коджима (37) на фотографиях Накамуры Казутаки (中村和孝) для Young Magazine, номер за 8 декабря. ...
Из года в год лишь март теплом задышит И вербам серьги первые развесит, На всех окрестных чуть прогретых крышах Коты весенние заводят песни. Им надоели душные квартиры, ...
Как же давно я сюда не заглядывала! А вот соскучилась и заглянула. Писать стала совсем мало, периодически делюсь новостями в соцсетях, публикуя фото с короткими текстами. Читаю чаще дзен и телеграм каналы, отдельно идёт мониторинг новостей родных и друзей. А сейчас, в рамках ...
Здравствуйте уважаемые. Приятного времени ...