Оцінка якості мультимодального аналізу відеореклами за допомогою LLM
Abstract
Стрімке зростання обсягів цифрової відеореклами вимагає нових автоматизованих підходів до її
аналізу та маркування. Світові витрати на цифрову відеорекламу у 2024 році перевищили $190 млрд [5], що
підтверджує високий попит на ефективне таргетування. Водночас великий потік відеоконтенту робить ручне
маркування неефективним [5]. У цьому контексті актуальною є оцінка можливостей новітніх великих мовних
моделей (LLM) для повноцінного мультимодального аналізу рекламних відеороликів. У тезах розглядається
потенціал GPT-5.1 і Google Gemini 2.5 Pro як інструментів такого аналізу, подано порівняння їхніх
можливостей та зроблено практичні висновки.
