Современные нейросети

2. ЧатГПТ вроде как понимает текстовый ввод, но это не точно.
3. разные там Кандински. умеют рисовать картинки, понимают текстовый ввод.
А вот вопрос. есть ли нейросети, которые переводят картинку в текст с разметкой? ну, типа файнридера. или все прорывы вокруг нейросетей сейчас почти только вокруг генерации правдоподобного текста/картинок, а с распознаванием пока что очень и очень ёк?
|
</> |