極客號(hào)(Daydx.com)8月9日 消息:VidLNs 是谷歌推出的一種視頻注釋工具,可以生成豐富的視頻描述,并實(shí)現(xiàn)準(zhǔn)確的時(shí)空定位。這是一種注釋視頻的增強(qiáng)方法,通過(guò)同時(shí)使用語(yǔ)音描述和鼠標(biāo)移動(dòng)來(lái)構(gòu)建視頻的敘述。
VidLNs 的注釋過(guò)程包括觀察視頻、選擇關(guān)鍵幀、逐個(gè)角色構(gòu)建敘述,并使用語(yǔ)音描述和鼠標(biāo)移動(dòng)來(lái)標(biāo)記相關(guān)對(duì)象和動(dòng)作。
項(xiàng)目地址:https://github.com/google/video-localized-narratives
通過(guò)選擇關(guān)鍵幀來(lái)表示每個(gè)角色的重要時(shí)刻,并通過(guò)口述描述和鼠標(biāo)指導(dǎo)來(lái)突出顯示相關(guān)對(duì)象和動(dòng)作。這種方法可以生成詳細(xì)的視頻注釋,為視頻敘事定位和視頻問(wèn)答等任務(wù)提供了堅(jiān)實(shí)的基礎(chǔ)。
核心功能:
1. 通過(guò)語(yǔ)音描述和鼠標(biāo)移動(dòng)來(lái)構(gòu)建視頻敘述。
2. 使用關(guān)鍵幀來(lái)突出顯示每個(gè)角色的關(guān)鍵時(shí)刻。
3. 提供準(zhǔn)確的時(shí)空定位,生成詳細(xì)的視頻注釋。
4. 為視頻敘事定位和視頻問(wèn)答等任務(wù)提供基礎(chǔ)。