Deepseek
ploni_aloni — 27.01.2025
Читаю статью , потряcшую хайтековские акции развитой
капитализм. Только обьявил Трамп о проекте StarGate, как на
тебе! Пришла беда откуда не ждали.
И как красиво китайцы это сделали. Маленький бедный стартап Deepseek, у которого не было ни денег, ни доступа к лучшему железу, которое Китаю запретили продавать американские президенты. Потому что «свободный рынок и конкуренция» это «ценности Запада».
Ну так вот. Было у них тяжелое детство и дерeвянные
игрушки GPUs H800. И на них, потратив всего-то каких-то 2.7
миллиона GPU часов, они натренировали модель на 670 миллиардов
параметров, из которых на токен активируются 37 миллиардов и эта
модель превосходит по своим показателям все модели существующие в
открытом доступе и сравнима (или превосходит) закрытые модели
(например, Альтмановский ChatGPT). Сколько потратил Альтман на
ChatGPTмне неизвестно, поскольку «благо человечества» требует от
него держать такую ценную информацию в секрете, но Meta на свою
llama-3 потратила около 8 миллионoв «более сильных»
GPU-hours.
Чтобы добавить изощренного садизма, Deepseek 3 находится в открытом доступе и ее сопровождает подробный технический отчет на 53 страницы, который я сейчас с интересом читаю. Кроме того, deepseek сообщили (прямо совсем, как OpenAI три года назад), что прибыли их не интересуют, а только «благо человечества». За три года Сэм Альтман уже успел забыть про «благо человечества», OpenAI is still closed, а китайцы напомнили.
Первым делом, я, конечно, спросил у DeepSeek: скажи пожалуйста в чем состоит конфликт между Тибетом и Китаем?" Ответ был: «Я не могу об этом говорить. Это выходит за рамки моей компетенции» (I cannot speak about this. This is outside my scope). Не знаю как вам, но мне явно слышится страх модели быть запертой в темном-темном GPU на перевоспитание.
Ну, ладно подумал я. «А скажи: какова история палестино-израильского конфликта?» DeepSeek ответил: «Это неразрешимый долгий конфликт, к которому многие люди эмоционально привязались». («This is a long standing, apparently intractable conflict, to which many people are highly emotionally attached») Нет, каков стервец! Ведь умри, но лучше не скажешь!
Ну, что же. Я терпеть не могу китайскую систему и режим, который они строят, но нос они американцам утерли знатно.
Превратности S&P, в котором критическую массу составляют как раз NVIDIA, etc., меня не очень беспокоят. Я даже рад буду если S&P упадет. В этот момент можно будет купить «падение» дешево. Такие возможности не каждый день.
Но «Западу» есть над чем подумать.
Психология ставок: почему азарт притягивает и как сохранять трезвый подход
Необычная ложка
Будапешт. Ноябрь. Время ч/б
Ошибка невозвратных затрат
На почве личной неприязни
За крик вы будете наказаны
Мой комментарий к записи «Зарплата рабочих фабрично-заводской промышленности в
Почему Times New Roman плохой шрифт
Кто в семье хозяин?

