網(wǎng)上有很多關(guān)于聯(lián)動(dòng)pos機風(fēng)控,網(wǎng)易易盾內容風(fēng)控實(shí)踐的知識,也有很多人為大家解答關(guān)于聯(lián)動(dòng)pos機風(fēng)控的問(wèn)題,今天pos機之家(m.xjcwpx.cn)為大家整理了關(guān)于這方面的知識,讓我們一起來(lái)看下吧!
本文目錄一覽:
聯(lián)動(dòng)pos機風(fēng)控
導讀:隨著(zhù) AI 技術(shù)的發(fā)展,AI識別技術(shù)顯著(zhù)提升了不良信息攔截的效率,從而幫助互聯(lián)網(wǎng)構建起更加健康的內容生態(tài)環(huán)境。然而 AI 技術(shù)面臨最嚴峻的挑戰來(lái)自于數據。如何從場(chǎng)景的角度更加深入地理解和分析數據場(chǎng)景的特點(diǎn),如何從技術(shù)方案的角度更加完善地完成數據的定義、描述、收集、選擇、迭代和管理等環(huán)節,如何從算法的角度更大程度地利用數據的價(jià)值,已經(jīng)成為深度網(wǎng)絡(luò )和 AI 技術(shù)發(fā)揮更大作用的關(guān)鍵和前提。
本文將從 Data-Centric AI 的角度出發(fā),分享網(wǎng)易易盾在內容風(fēng)控方面的實(shí)踐和思考。主要包括以下 4 個(gè)方面:
Data-Centric AI 背景、意義和概念內容風(fēng)控場(chǎng)景的業(yè)務(wù)和數據特點(diǎn)數據方案、數據管理和數據流程算法創(chuàng )新和數據價(jià)值之間的關(guān)系和作用分享嘉賓|胡宜峰 網(wǎng)易易盾 計算機視覺(jué)資深算法工程師
編輯整理|李聰玥 平安科技
出品社區|DataFun
01
Data-Centric AI 背景、意義和概念
一個(gè)完整的 AI 系統包括數據、算法/模型、解決方案和部署等多個(gè)方面。絕大多數精力都集中在數據以外的環(huán)節。這個(gè)現象的原因,歸結有二:
學(xué)術(shù)界有很多固定的公開(kāi)數據集存在,數據相對來(lái)說(shuō)是一個(gè)比較靜態(tài)的狀態(tài)。在工業(yè)界,大家往往有一個(gè)誤區,認為數據就等同于標注。這兩方面的原因導致我們對數據關(guān)注的程度不夠。對于常規的算法優(yōu)化或者模型訓練過(guò)程,我們往往是在數據固定的前提下,追求在測試集上的高指標,但是如果把這種方式應用在業(yè)務(wù)落地,尤其是內容風(fēng)控場(chǎng)景,我們會(huì )發(fā)現在測試集上表現較好的模型在線(xiàn)上或真實(shí)場(chǎng)景上可能存在較大的反差。造成這個(gè)差距的一個(gè)重要原因就是沒(méi)有在數據流程上投入足夠的精力。這也是我們今天談到 Data-Centric AI 的一個(gè)核心點(diǎn)。
Data-Centric AI 這個(gè)概念最早是由 Andrew Ng 提出的,他在提出這個(gè)概念的同時(shí),在非常大的范圍內做了一個(gè)投票的調研,調研人群主要是一些科研人員和業(yè)界的從業(yè)人員,其中 80% 的人認為相較于模型或者算法、解決方案等,數據起到的作用是最大的。這也在一定程度上表明了 Data-Centric AI 的意義。
他做了一個(gè)很形象的比喻,就好比是做飯,數據相當于挑選食材和準備食材的過(guò)程,但是這部分僅僅占據了 1% 的研發(fā)資源;模型訓練或者解決方案等同于烹飪階段,這部分則占據了 99% 的精力和研發(fā)資源。這也反映了我們對數據的關(guān)注是不夠的。
尤其在內容風(fēng)控等 AI 落地的場(chǎng)景中,一個(gè)表現優(yōu)秀的模型需要的是數據和模型的互動(dòng),兩者是互相促進(jìn)的關(guān)系。優(yōu)質(zhì)的訓練數據能提升模型在真實(shí)場(chǎng)景上的效果和泛化能力,好的模型反過(guò)來(lái)也能促進(jìn)我們更加快速地生成、自動(dòng)獲取或者人工標注出更高質(zhì)量的訓練數據。兩者是相輔相成,螺旋上升的過(guò)程。
這就是 Data-Centric AI 的核心觀(guān)點(diǎn)。
--
02
內容風(fēng)控場(chǎng)景的業(yè)務(wù)和數據特點(diǎn)
接下來(lái)介紹一下內容安全/內容風(fēng)控場(chǎng)景。
1. 內容風(fēng)控場(chǎng)景的業(yè)務(wù)
由于我們正處于一個(gè)海量互聯(lián)網(wǎng)數據的時(shí)代,隨著(zhù)互聯(lián)網(wǎng)的發(fā)展,內容載體從最開(kāi)始的圖文發(fā)展到現在的文本、圖像、音頻、視頻和直播等等,在量和速度上都有著(zhù)飛速的提升。
內容生成、內容制作的流程也更加敏捷和快速。一方面產(chǎn)生的數據量正在大幅增加,另一方面內容制作發(fā)布的審核流程在不斷簡(jiǎn)化,這樣一正一反帶來(lái)了很大的內容安全隱患和壓力。針對可能出現的各種內容安全隱患,網(wǎng)易易盾做了比較全面深入的研發(fā)。
這里只展示了一部分,主要包括色情廣告、違禁、涉政、暴恐、涉價(jià)值觀(guān)、增值服務(wù)、輔助能力等大類(lèi)。這些大類(lèi)當中細分的方面非常多,包含的垂直領(lǐng)域和垂直類(lèi)型也非常多。對于這些內容,網(wǎng)易易盾從廣度、深度和粒度這三個(gè)方面都做了比較全面的覆蓋。
2. 內容安全場(chǎng)景數據特點(diǎn)
相比于其他 AI 場(chǎng)景,內容安全場(chǎng)景的數據有著(zhù)如下一些明顯的特點(diǎn)。
首先是極端的長(cháng)尾分布,內容安全領(lǐng)域是面向海量互聯(lián)網(wǎng)數據服務(wù)的,線(xiàn)上隨機流量中違規數據占比是極低的。因此用大海撈針來(lái)形容內容安全的算法和服務(wù)一點(diǎn)都不為過(guò)。我們要從海量的互聯(lián)網(wǎng)數據當中去撈出這些占比極低的違規類(lèi)型,還要保證撈出的數據的精確度。
第二個(gè)特點(diǎn)是數據中存在很多特征非常相似、可解釋性非常高,但不屬于違規的數據。在處理海量數據時(shí),無(wú)論從視覺(jué)還是其它層面,都存在易誤判、極端的細粒度和難例挖掘的問(wèn)題。
第三個(gè)特點(diǎn)是極端的小目標識別,在識別違禁區域時(shí),比如抽煙識別,抽煙動(dòng)作是有明確特征的,但在一些很遠的場(chǎng)景中,比如拿著(zhù)一個(gè)煙頭而并沒(méi)有去抽它,這也屬于抽煙識別的范疇。這個(gè)煙頭可能占的像素區域只有 3*3,也就是要識別一個(gè) 3 *3 的像素區域的標簽是否違禁,決定性的違禁區域非常小,是一個(gè)極端的小目標識別問(wèn)題。
最后一個(gè)特點(diǎn)是極端的開(kāi)放域識別,很多時(shí)候違禁類(lèi)型并不是固定的,識別類(lèi)別是多樣的、不確定的以及頻繁增加的。
除了這些問(wèn)題之外,在內容安全領(lǐng)域,還有其它一些問(wèn)題,比如極端的域泛化,由于我們面向的是海量互聯(lián)網(wǎng)數據,數據域的變化廣泛而頻繁。還有極端的模型防守對抗問(wèn)題,內容安全存在頻繁地跟黑灰產(chǎn)對抗的問(wèn)題。黑灰產(chǎn)通過(guò)一些模型的攻擊,或是通過(guò)一些編輯,甚至PS等方式去做對抗,這也是我們頻繁遇到的一個(gè)問(wèn)題。當然我們也會(huì )存在一些比如類(lèi)別邊界比較模糊、數據質(zhì)量差別大這種與其它 AI 場(chǎng)景類(lèi)似的問(wèn)題。
--
03
數據方案、數據管理和數據流程
1. 數據管理
數據管理和流程貫穿在初始模型訓練、模型的迭代訓練和模型測試整個(gè)環(huán)節,主要包括數據的刻畫(huà)、收集、生成與拓展、標注、增強、選擇、清洗、分析和迭代等等。這些環(huán)節不是孤立的,而是互相銜接補充以及包含的。
額外講一下模型測試這個(gè)環(huán)節,我們從 Data-Centric AI 的角度來(lái)看,模型的測試其實(shí)就是測試數據選擇的一個(gè)過(guò)程。選擇數據要對齊線(xiàn)上最終的落地場(chǎng)景的數據分布,要對齊一些特定的歷史反饋。這也是從數據的角度去看模型測試。
2. 數據刻畫(huà)
我們啟動(dòng)一個(gè)業(yè)務(wù)時(shí),數據刻畫(huà)起到了非常重要的作用。如果數據的定義和刻畫(huà)考慮不全面,一方面會(huì )增加識別和迭代的難度,另一方面也會(huì )增加數據標注的成本,影響可用性。
所以需要有比較全面的評估,構建多級標簽的體系,分析標簽的包含、互斥、歧義的關(guān)系,對識別范圍進(jìn)行有效的擴展,對相似的易誤判的標簽進(jìn)行分析,考慮標簽的通用性,同時(shí)細化邊界和細節描述,關(guān)注標注復雜度。
標注數據刻畫(huà)這個(gè)環(huán)節可能偏經(jīng)驗一些,我們很難詳細地把經(jīng)驗說(shuō)清楚,但是我們的目標是希望降低模型識別的難度、模型迭代的難度以及降低標注的難度,并提升標注的可用性。
3. 數據收集
在有了詳細的數據刻畫(huà)和描述的積累之后,我們就需要對數據進(jìn)行收集。一方面模型的冷啟動(dòng)需要數據收集,另一方面數據的收集和補充也貫穿在整個(gè)模型迭代過(guò)程中,數據收集需要考慮擴充數據分布范圍、對齊應用場(chǎng)景數據分布、提高標注的命中率和針對性、提高標注質(zhì)量等幾方面問(wèn)題。
以上幾種方式共同使用,可以提高標注的命中率和針對性,從而提高標注樣本的質(zhì)量。
數據精細化的管理包括三方面的內容,一個(gè)是數據生成,一個(gè)是數據的自動(dòng)獲取,即標簽的自動(dòng)獲取,也可以簡(jiǎn)單地理解成模型打標,還有一個(gè)是人工的標注。在正式做數據標注之前,我們可以問(wèn)自己一個(gè)問(wèn)題,這個(gè)數據是不是真的需要標注。
4. 數據生成與拓展
數據生成也是一個(gè)比較重要的環(huán)節,因為有部分業(yè)務(wù)場(chǎng)景的數據,不一定非要有數據的標注,再進(jìn)行模型的初始訓練的冷啟動(dòng)方式。數據生成是能讓模型快速地自動(dòng)獲取初始能力的方式。當然這里的數據生成并不是狹義上的理解,比如我們通過(guò)各種分割加貼圖的方式去做貼圖或者用圖像生成的方法去生成數據,我們生成的初衷是希望模型有快速的初始能力。所以通過(guò)一些無(wú)監督和小樣本學(xué)習的方式,讓模型有快速地初始識別的能力,在我們看來(lái)其實(shí)也屬于生成和冷啟動(dòng)的范疇。
此時(shí)生成的數據有一個(gè)很大的特點(diǎn),數據分布是非常有局限性的,可能具有初步的能力,但是能力比較有限。從生成的數據到正式數據分布的擴展是很重要的環(huán)節。以 Logo 識別為例,我們結合技術(shù)方案,設計跨任務(wù)的數據增廣擴展的模塊可以很好地實(shí)現生成數據到真實(shí)數據分布的擴展。所以在數據標注之前,數據生成是非常重要的一個(gè)環(huán)節。但也并不是所有的業(yè)務(wù)場(chǎng)景都可以采用數據生成冷啟動(dòng)。
5. 數據標注
數據標注有一些需要注意的點(diǎn)。
首先為了降低標注的難度,我們需要細化標注文檔、細節、邊界解釋等。
第二點(diǎn),為了降低標注的成本,提高標注的有效性,模型的預標注非常重要,模型對標注的數據有一定的識別效果,如果全部從頭去標,有很大的標注浪費,因此尤其是對一些復雜場(chǎng)景的模型標注,用模型的預標注結合人工標注是非常重要的一點(diǎn)。
第三點(diǎn),就是希望提高標注的命中率和有效性,比如抽煙行為的標注,希望能標出抽煙的行為,如果隨機選擇數據去標注,絕大多數都是正常的,標出這些數據是沒(méi)有什么用的,所以要結合數據的選擇和清洗去標注。
第四點(diǎn)是從可信度的角度去考慮,比如在標注數據時(shí),考慮的可能是違禁或者違規相關(guān)的屬性,如果不關(guān)注那些與違禁無(wú)關(guān)的屬性,可能會(huì )導致模型訓練是有偏的。所以從可信度的角度來(lái)說(shuō),要降低這種數據的偏向,對于一些不關(guān)心的屬性,也要做一個(gè)均勻的采集和采樣。
第五點(diǎn)是希望提高標注的準確率和可用性,需要一些交叉驗證和標注質(zhì)檢的方式。
第六點(diǎn)是很重要的一點(diǎn),與第二點(diǎn)類(lèi)似,標注和模型訓練需要高頻交叉進(jìn)行,不建議一次提很大量級的數據去做標注,因為可能會(huì )浪費。我們希望用不是很大量級的數據去做高頻的交互,這樣可以降低數據標注的開(kāi)銷(xiāo),提高數據標注的可用性。
6. 數據增強
數據增強這塊大家都非常熟悉,這里就不做詳細的介紹了。
7. 數據選擇與清洗
精細化的數據流程當中比較核心的點(diǎn)是數據的選擇和清洗。數據可能是生成的,或是模型打標的,也可能是人工打標的。我們要做的事情是區分什么時(shí)候能生成,什么時(shí)候需要模型去標注,什么時(shí)候需要人工標注。在人工標注這塊還要考慮一個(gè)很重要的點(diǎn)是用什么樣的數據去標注才是最好的,能更大地利用標注的有效性,降低標記資源的開(kāi)銷(xiāo)。
數據的選擇與清洗,是比較重要的環(huán)節,這里應用的前提是模型已經(jīng)越過(guò)冷啟動(dòng)階段,有比較不錯的能力,到達深層次迭代的環(huán)節。數據的選擇應用的環(huán)節主要包括選擇哪些數據直接應用到模型訓練、選擇哪些數據進(jìn)行數據標注、從已有訓練集中剔除哪些(簡(jiǎn)單的)訓練數據、如何構建半監督unlabel data數據集等等。這里我們考慮的點(diǎn)主要是上圖中所列的五個(gè)方面。在選擇數據進(jìn)行標注的時(shí)候我們考慮的一般是uncertainty、diversity、distribution三個(gè)方面,我們肯定是要選擇不確定性高、豐富度高、并且數據分布廣泛的數據用于標注。在應用模型打標的方面,我們還要額外考慮Accuracy和Balance的問(wèn)題。
針對上圖左側所列這些熱點(diǎn)領(lǐng)域的研究和應用,在內容安全的場(chǎng)景中都取得了明確的收益。比如Active Learing,對應于Uncertainty和Diversity的要求。然而當你遇到的是完全adversarial的樣本,或是當對域外的數據完全無(wú)召回能力的時(shí)候,通過(guò)結合OOD和few shot learning的方法可以進(jìn)一步提升域外數據的召回能力,從而對應于distribution的要求。在我們提升樣本accuracy的時(shí)候,置信學(xué)習、noisy training的方法也是有效的提升標簽準確率的方法。
這樣,三條鏈路就非常清楚了,什么數據去生成,什么數據去標注,什么數據直接用,是一個(gè)半自動(dòng)化的過(guò)程。這樣相較于隨機采數據去標這種最原始的方式,不僅減少了標注資源,效果也會(huì )有一個(gè)量級的提升。這樣,從數據角度,我們可以更好更快地去響應需求,提升模型的效果。當真正去做業(yè)務(wù)落地的時(shí)候,很難做到全自動(dòng),肯定也要有一些人工的數據分析。
數據分析的內容包括當前版本的整體進(jìn)度召回的情況,特定類(lèi)型的召回情況,歷史反饋的召回情況,模型版本之間的差異以及易誤判類(lèi)型的歸納。我們會(huì )做一個(gè)定向的數據補充,與數據生成、數據選擇清洗是互補的,這樣可以更好地去完成數據運作的流程。還包括一些特定的場(chǎng)景分析,比如這個(gè)類(lèi)型可能在某個(gè)固定的場(chǎng)景下的效果不好,這時(shí)就需要人工參與以及一些經(jīng)驗的總結。
8. 數據迭代
關(guān)于數據迭代過(guò)程,在此不做詳細討論。前面介紹的數據標注、清洗、選擇、增強、分析其實(shí)都結合在耦合了半監督和自監督的整個(gè)數據迭代的框架里。核心點(diǎn)是我們希望無(wú)論是數據的生產(chǎn)、模型的打標還是人工的打標,都能最大程度地發(fā)揮數據的價(jià)值。在盡量小的開(kāi)銷(xiāo),盡量快的速度,盡量短的周期和盡量高的頻率的前提下,最大程度去發(fā)揮數據的價(jià)值。
9. 數據測試與驗證
內容風(fēng)控場(chǎng)景可能用到非常多的技術(shù)手段,但是歸根到底可以理解為一個(gè)識別問(wèn)題或者內容理解問(wèn)題。數據測試需要對齊我們的任務(wù)。測試的內容,一個(gè)是數據,一個(gè)是指標,一定是要對齊最后的目標。測試的數據要對齊最終的目標,這個(gè)很好理解。測試的指標也是要對齊最后的應用。一些中間的環(huán)節,包括一些很偏算法的指標,不能很好地反映出最終端到端的效果。數據和指標都對齊,才能保證不會(huì )出現離線(xiàn)側效果很好而線(xiàn)上效果很差這種情況。
上圖是整體的內容安全的 AI 架構。
除了數據之外,算法側還包括算法模型的優(yōu)化、算法的解決方案的優(yōu)化、速度性能的優(yōu)化。這三個(gè)方面也是非常重要的思考點(diǎn)。我們在做任何一個(gè)算法時(shí),都是從這四個(gè)方面共同去努力的。數據的管理和價(jià)值的利用也為后續的幾個(gè)方面提供了廣闊的空間。
以上從系統化、流程化、精細化的數據工作介紹了我們在內容安全領(lǐng)域對 Data-Centric AI 的理解和實(shí)踐,我們的目標是,希望無(wú)論數據的生成、模型的打標,還是人工的打標,都能在盡量減小開(kāi)銷(xiāo)的前提下,最大程度地發(fā)揮數據的價(jià)值。
--
04
算法創(chuàng )新和數據價(jià)值之間的關(guān)系和作用
1. 自監督
自監督這個(gè)方向,有著(zhù)非常強的任務(wù)相關(guān)性和場(chǎng)景相關(guān)性,所以我們去構建任務(wù)和場(chǎng)景相關(guān)的自監督基礎模型集合是非常有效的從最開(kāi)始的階段就去發(fā)揮數據價(jià)值的一種方式。比如武器大類(lèi),有非常多種類(lèi)的違禁武器;服飾大類(lèi),有宗教服飾、公職服飾、暴恐服飾等。我們發(fā)現,在某個(gè)大類(lèi)上做一個(gè)統一的基礎模型是非常有效的。做一個(gè)具體垂類(lèi)的任務(wù),我們希望在這個(gè)大類(lèi)有一個(gè)比較好的或者幾個(gè)比較好的初始模型,作為以后這個(gè)方向具體的新業(yè)務(wù)模型的一個(gè)初始。
2. 半監督
我們在業(yè)務(wù)中發(fā)現,半監督的方法很多時(shí)候解決的是穩定性的問(wèn)題,難以實(shí)現域的跨越。針對這個(gè)問(wèn)題,我們也做了一些嘗試,篇幅有限就不在此介紹了。
3. 弱監督
弱監督這個(gè)方向,包括弱監督的定位、檢測、分割等等,能幫助我們更加充分地發(fā)掘出更細粒度的內容信息,從而提升識別的效果。這個(gè)方向如果和解決方案聯(lián)動(dòng),有非常多的方式可以去挖掘。比如部分場(chǎng)景問(wèn)題,用分類(lèi)標簽就可以拿到非常好的分割結果。也就是說(shuō)從這種標注難度非常低的監督入手,能獲取到更細粒度的監督信息,再結合解決方案的改進(jìn),是一個(gè)非常好的提升數據利用價(jià)值的方向。
另外,無(wú)監督,開(kāi)放域識別、小樣本等等都會(huì )包括在整個(gè)數據流程中,它們不能直接地解決一個(gè)業(yè)務(wù)問(wèn)題,但可以在業(yè)務(wù)場(chǎng)景中的某些環(huán)節起到非常大的作用。
--
05
問(wèn)答環(huán)節
Q1:模型預標注和人工智能標注怎樣才能有效地結合?
A1:我認為結合方式是可以在構建標注系統的時(shí)候,有一個(gè)預標注的功能。我們標注的時(shí)候并不一定是從頭去標注,因為有些標注比如 OCR 的標注,或是一些很細的類(lèi)別的標注,如果從頭去標,復雜度非常高。從標注的人員來(lái)看,如果有一個(gè)預標簽,模型對標注數據肯定是有識別能力的,當然不包括冷啟動(dòng)階段,但是絕大多數是在中間的這樣一個(gè)迭代的環(huán)節中。如果有預標簽,標注人員一掃過(guò)去,發(fā)現模型給的是對的,就不用再做操作了。如果有標注都要人工去點(diǎn),操作的復雜度和操作的差距都是非常大的。所以模型的預標注是在開(kāi)始做標注系統的時(shí)候就需要考慮的一個(gè)功能。
Q2:請問(wèn)對于類(lèi)別邊界模糊的問(wèn)題,除了盡可能地將標簽體系建立完備之外,從模型算法的角度還有經(jīng)驗可以分享嗎?是否可以考慮采取相似圖的檢索的方式進(jìn)行圖像的鑒別和分類(lèi)呢?
A2:我覺(jué)得這也是非常好的一個(gè)問(wèn)題。邊界模糊在算法里是細粒度分類(lèi)的問(wèn)題。首先,分類(lèi)標準一定要清晰,否則標注是標不出來(lái)的。第二個(gè)需要從解決方案去做設計。比如在一個(gè)模型里,有 A、B、C 三個(gè)類(lèi)型,其中 C 是正常,A 和 B 是兩個(gè)非常近的類(lèi)型,但A是違規的,B 是不違規的,那其實(shí) B 和 C 是一類(lèi)的,A 是一類(lèi)的。如果你的模型需要區分 A 和 BC 的話(huà),就會(huì )出現一個(gè)非常大問(wèn)題,即 AB 是屬于兩類(lèi)的,而它們的類(lèi)間距非常小,這其實(shí)是在給模型找麻煩。我覺(jué)得可以很好地去理解這樣一個(gè)問(wèn)題,在流行的流程設計中,我們可以做一些難易的區分,也就是前置的一些模型僅去區分 C 和 AB,但在后面的細粒度的模型當中,只是做細粒度的一個(gè)分類(lèi),并不需要去區分,數據分布劃開(kāi)了之后,針對性就會(huì )更強,模型效果也會(huì )有明顯的提升。從模型設計上,這種層級的難易區分的設計和考慮是非常重要的,這同時(shí)也是從速度的角度去考慮的。
你提到檢索環(huán)節是肯定的,現在最好的方式就是模型加庫,單對模型來(lái)說(shuō),即使我們現在的流程做得很完善,數據運作的流程,包括如何生成數據,如何去打標,如何機器打標做得很快,其實(shí)也有一個(gè)周轉的過(guò)程,很難做到實(shí)時(shí)的響應。模型加庫的方式,從特征檢索的角度來(lái)看,有很快的響應的過(guò)程,但是檢索也會(huì )有它的問(wèn)題,兩者之間是一個(gè)互補的關(guān)系。第一個(gè)是標注邊界細化這種方向,第二個(gè)是流程解決方案的設計方向,第三,你說(shuō)的檢索也是一個(gè)比較通用的方向。所以,我覺(jué)得模型和庫的配合也已經(jīng)是非常重要的一點(diǎn)。
今天的分享就到這里,謝謝大家。
|分享嘉賓|
胡宜峰
網(wǎng)易易盾 計算機視覺(jué)資深算法工程師
胡宜峰,畢業(yè)于中國科學(xué)技術(shù)大學(xué),具有多年AI算法研發(fā)經(jīng)驗。研究方向包括圖像分類(lèi)、目標檢測、實(shí)例分割、圖像檢索、視頻深度鑒偽等,在計算機視覺(jué)方向和內容安全領(lǐng)域有豐富的算法研究和項目研發(fā)經(jīng)驗。
|DataFun新媒體矩陣|
|關(guān)于DataFun|
專(zhuān)注于大數據、人工智能技術(shù)應用的分享與交流。發(fā)起于2017年,在北京、上海、深圳、杭州等城市舉辦超過(guò)100+線(xiàn)下和100+線(xiàn)上沙龍、論壇及峰會(huì ),已邀請超過(guò)2000位專(zhuān)家和學(xué)者參與分享。其公眾號 DataFunTalk 累計生產(chǎn)原創(chuàng )文章800+,百萬(wàn)+閱讀,15萬(wàn)+精準粉絲。
以上就是關(guān)于聯(lián)動(dòng)pos機風(fēng)控,網(wǎng)易易盾內容風(fēng)控實(shí)踐的知識,后面我們會(huì )繼續為大家整理關(guān)于聯(lián)動(dòng)pos機風(fēng)控的知識,希望能夠幫助到大家!
