中文字幕s级优女区,欧美人人草,色综合九九,伊香蕉大综综综合久久,久久99精品久久久久久牛牛影视,国产成人综合久久,中文久草

用于處理視頻的方法和電子設(shè)備與流程

文檔序號:42431696發(fā)布日期:2025-07-11 19:31閱讀:856來源:國知局

本公開總體上涉及圖像處理領(lǐng)域,更具體地,涉及用于在視頻壓縮期間從視頻中去除一個或多個偽像的電子設(shè)備和方法。


背景技術(shù):

1、視頻壓縮(也稱為視頻譯碼(coding))是一種在維持可接受的視覺質(zhì)量水平的同時減小數(shù)字視頻文件大小的處理。視頻壓縮的主要目標(biāo)是減少存儲或傳輸視頻所需的數(shù)據(jù)量,使其在各種網(wǎng)絡(luò)上的存儲、流式傳輸和傳輸更加高效。隨著技術(shù)的進(jìn)步,在與視頻壓縮相關(guān)聯(lián)的壓縮流水線中使用了基于人工智能(artificial?intelligence,ai)的譯碼工具。對于作為壓縮流水線的一部分的基于ai的譯碼工具,基于ai的譯碼工具應(yīng)當(dāng)在降低傳輸成本的同時提高圖像或視頻的質(zhì)量。此外,基于ai的譯碼工具在其內(nèi)存要求和計算要求方面需要是輕量級的。因此,需要參數(shù)很少的低復(fù)雜度的小型ai模型,使基于ai的譯碼工具是設(shè)備友好的。

2、一般來說,訓(xùn)練數(shù)據(jù)在基于ai的模型中起到關(guān)鍵的作用,使基于ai的模型能夠?qū)W習(xí)正確的特征。訓(xùn)練數(shù)據(jù)的意義在訓(xùn)練低復(fù)雜度的輕量級的基于ai的模型的同時變得更加明顯,因?yàn)檫@些基于ai的模型固有地缺乏多個參數(shù)來學(xué)習(xí)存在于訓(xùn)練數(shù)據(jù)內(nèi)的所有錯綜復(fù)雜。換句話說,低復(fù)雜度的輕量級的基于ai的模型往往欠擬合且泛化能力差。在視頻編解碼器中,每個幀都具有其獨(dú)特的重要性,而這會轉(zhuǎn)化成最終的壓縮增益。例如,較早出現(xiàn)在圖片組(group?of?pictures,gop)層次結(jié)構(gòu)(即,圖像序列)中的幀具有較高的重要性,因?yàn)樗鼈儽挥米鬏^晚幀的參考。而且,在壓縮流水線中對視頻進(jìn)行編碼的同時,每個幀都具有其自身的重要性,而這會轉(zhuǎn)化成最終的bjontegaard?delta(bd)速率增益。因此,為了總體性能提升,當(dāng)務(wù)之急是聚焦于重要幀而非不重要幀的質(zhì)量增強(qiáng)。

3、常規(guī)上,存在多種解決方案在壓縮流水線中使用基于ai的模型。然而,在常規(guī)的解決方案中,基于ai的模型要么用于替換某些壓縮塊,要么與壓縮塊相結(jié)合地使用。例如,基于ai的環(huán)內(nèi)濾波器(in-loop?filter)與傳統(tǒng)的環(huán)路濾波器一起使用,以檢測和校正某種類型的偽像?;赼i的環(huán)內(nèi)濾波器(也稱為基于ai的環(huán)路濾波器或基于ai的去塊(deblocking)濾波器)是視頻壓縮技術(shù)中的前沿增強(qiáng),其利用ai技術(shù)來提高解碼過程期間的視頻質(zhì)量。為了訓(xùn)練這種基于ai的模型,基于基于ai的環(huán)內(nèi)濾波器接收的輸入來收集訓(xùn)練圖塊(patch)。例如,如果將基于ai的環(huán)內(nèi)濾波器放置在傳統(tǒng)濾波器之后,則傳統(tǒng)濾波器的輸出可以用作基于ai的模型的輸入。然而,在gop中,一些幀的優(yōu)先級高于其他幀。因此,可能出現(xiàn)在這些高優(yōu)先級幀中的任何質(zhì)量損失都可能傳播到涉及高優(yōu)先級幀的幀。一般來說,利用較高量化參數(shù)(quantization?parameter,qp)值來量化優(yōu)先級較低的幀,并且它的塊經(jīng)常被編碼流水線跳過。因此,從這種幀中提取訓(xùn)練圖塊可能不會給訓(xùn)練數(shù)據(jù)添加任何的值。此外,這種附加的數(shù)據(jù)(訓(xùn)練圖塊)可能擾亂和偏離低復(fù)雜度的小型ai模型的重點(diǎn),使其無法學(xué)習(xí)正確的特征。此外,在其他常規(guī)的解決方案中,針對不同的幀類型(諸如基于gop中的每個幀的位置)來訓(xùn)練特定的基于ai的模型。然而,這種特定的模型缺乏泛化能力。為了訓(xùn)練不同的ai模型,需要不同的訓(xùn)練數(shù)據(jù)子集來訓(xùn)練這些ai模型,這是時間和內(nèi)存密集的。

4、相應(yīng)地,需要一種能夠克服上述與用于從視頻中消除偽像的常規(guī)技術(shù)和方法相關(guān)聯(lián)的問題和限制的改進(jìn)型技術(shù)和方法。


技術(shù)實(shí)現(xiàn)思路

1、技術(shù)方案

2、提供本
技術(shù)實(shí)現(xiàn)要素:
是為了以簡化的形式引入一系列概念,這些概念將在本發(fā)明的詳細(xì)描述中進(jìn)一步描述。本發(fā)明內(nèi)容既不旨在認(rèn)定本發(fā)明的關(guān)鍵或必要的發(fā)明構(gòu)思,也不旨在確定本發(fā)明的范圍。

3、在本公開的實(shí)施例中,提供了一種處理視頻的方法。該方法可以包括獲得與壓縮視頻相關(guān)聯(lián)的多個重構(gòu)幀。該方法可以包括確定多個重構(gòu)幀中的每個重構(gòu)幀的優(yōu)先級水平。該方法可以包括從多個重構(gòu)幀中提取圖塊集合。該方法可以包括獲得基于所提取的圖塊集合或所確定的優(yōu)先級水平而訓(xùn)練的基于人工智能(ai)的環(huán)內(nèi)濾波器。

4、在本公開的實(shí)施例中,一種用于處理視頻的電子設(shè)備,電子設(shè)備可以包括存儲至少一個指令的存儲器和被配置為執(zhí)行至少一個指令的至少一個處理器。至少一個處理器可以被配置為獲得與壓縮視頻相關(guān)聯(lián)的多個重構(gòu)幀。至少一個處理器可以被配置為確定多個重構(gòu)幀中的每個重構(gòu)幀的優(yōu)先級水平。至少一個處理器可以被配置為從多個重構(gòu)幀中提取圖塊集合。至少一個處理器可以被配置為獲得基于所提取的圖塊集合或所確定的優(yōu)先級水平而訓(xùn)練的基于人工智能(ai)的環(huán)內(nèi)濾波器。

5、在本公開的實(shí)施例中,一種其中存儲有指令的計算機(jī)可讀介質(zhì),該指令在由至少一個處理器執(zhí)行時,使得至少一個處理器執(zhí)行一種處理視頻的方法。該方法可以包括獲得與壓縮視頻相關(guān)聯(lián)的多個重構(gòu)幀。該方法可以包括確定多個重構(gòu)幀中的每個重構(gòu)幀的優(yōu)先級水平。該方法可以包括從多個重構(gòu)幀中提取圖塊集合。該方法可以包括獲得基于所提取的圖塊集合或所確定的優(yōu)先級水平而訓(xùn)練的基于人工智能(ai)的環(huán)內(nèi)濾波器。

6、為了進(jìn)一步闡明本發(fā)明的優(yōu)點(diǎn)和特征,將參考附圖所示的本發(fā)明的具體實(shí)施例來對本發(fā)明進(jìn)行更特定的描述。應(yīng)當(dāng)理解,這些附圖僅描繪了本發(fā)明的典型實(shí)施例,因此不應(yīng)被認(rèn)為是對其范圍的限制。將利用附圖以附加的特點(diǎn)和細(xì)節(jié)來描述和解釋本發(fā)明。



技術(shù)特征:

1.一種處理視頻的方法,所述方法(1100)包括:

2.根據(jù)權(quán)利要求1所述的方法(1100),進(jìn)一步包括:

3.根據(jù)權(quán)利要求1至2中任一項(xiàng)所述的方法(1100),其中獲得所述基于ai的環(huán)內(nèi)濾波器包括:

4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法(1100),其中確定所述多個重構(gòu)幀中的每個重構(gòu)幀的優(yōu)先級水平包括:

5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法(1100),其中確定所述多個重構(gòu)幀中的每個重構(gòu)幀的優(yōu)先級水平包括:

6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法(1100),其中獲得所述基于ai的環(huán)內(nèi)濾波器包括:

7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法(1100),進(jìn)一步包括:

8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法(1100),其中提取所述圖塊集合包括:

9.一種用于處理視頻的電子設(shè)備,所述電子設(shè)備(200)包括:

10.根據(jù)權(quán)利要求9所述的電子設(shè)備(200),其中所述至少一個處理器被配置為執(zhí)行所述至少一個指令以:

11.根據(jù)權(quán)利要求9至10中任一項(xiàng)所述的電子設(shè)備(200),其中所述至少一個處理器被配置為執(zhí)行所述至少一個指令以:

12.根據(jù)權(quán)利要求9至11中任一項(xiàng)所述的電子設(shè)備(200),其中所述至少一個處理器被配置為執(zhí)行所述至少一個指令以:

13.根據(jù)權(quán)利要求9至12中任一項(xiàng)所述的電子設(shè)備(200),其中所述至少一個處理器被配置為執(zhí)行所述至少一個指令以:

14.根據(jù)權(quán)利要求9至13中任一項(xiàng)所述的電子設(shè)備(200),其中所述至少一個處理器被配置為執(zhí)行所述至少一個指令以:

15.一種其中存儲有指令的計算機(jī)可讀介質(zhì),所述指令在由至少一個處理器執(zhí)行時,使得所述至少一個處理器執(zhí)行一種處理視頻的方法,所述方法(1100)是根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的。


技術(shù)總結(jié)
提供了一種處理視頻的方法。該方法可以包括獲得與壓縮視頻相關(guān)聯(lián)的多個重構(gòu)幀。該方法可以包括確定多個重構(gòu)幀中的每個重構(gòu)幀的優(yōu)先級水平。該方法可以包括從多個重構(gòu)幀中提取圖塊集合。該方法可以包括獲得基于所提取的圖塊集合或所確定的優(yōu)先級水平而訓(xùn)練的基于人工智能(AI)的環(huán)內(nèi)濾波器。

技術(shù)研發(fā)人員:P·甘古利,A·阿加瓦爾,A·辛格,R·N·加德,樸銀姬,樸慜祐,崔光杓
受保護(hù)的技術(shù)使用者:三星電子株式會社
技術(shù)研發(fā)日:
技術(shù)公布日:2025/7/10
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1