三级乱伦欧美无码,中国宾馆free普通话

深度 | AI 建模實(shí)際應(yīng)用場景及效益

2020-04-23 11:00 媒體投稿

導(dǎo)讀：隨著AI 科技的發(fā)展，過去很多無法應(yīng)用計(jì)算機(jī)算法分析的場景現(xiàn)在已經(jīng)成為可能，并且能經(jīng)由 AI 的算法帶來實(shí)際的業(yè)務(wù)效益，提升營收。本文將以普強(qiáng)的 AI 建模、語義理解、語音識別等相關(guān)技術(shù)為核心所建立的一套優(yōu)化商業(yè)場景機(jī)制，在行業(yè)中的實(shí)際應(yīng)用所產(chǎn)生的效益做詳細(xì)闡述。

隨著AI 科技的發(fā)展，過去很多無法應(yīng)用計(jì)算機(jī)算法分析的場景現(xiàn)在已經(jīng)成為可能，并且能經(jīng)由 AI 的算法帶來實(shí)際的業(yè)務(wù)效益，提升營收。本文將以普強(qiáng)的 AI 建模、語義理解、語音識別等相關(guān)技術(shù)為核心所建立的一套優(yōu)化商業(yè)場景機(jī)制，在行業(yè)中的實(shí)際應(yīng)用所產(chǎn)生的效益做詳細(xì)闡述。

國內(nèi)一名列世界500 強(qiáng)的保險(xiǎn)公司（以下簡稱“A 保險(xiǎn)公司”），擁有龐大的電銷團(tuán)隊(duì)，雇傭了上萬名電銷人員，每月電銷電話撥打量達(dá)到千萬通。由于客戶名單基本為白名單，即沒有客戶的信息，傳統(tǒng)的格式化維度分析無法應(yīng)用，所以A保險(xiǎn)公司在沒有客戶信息的情況下，實(shí)行全量撥打，這樣的撥打效果成交率在千分之一以下。另一方面，全量撥打的電銷電話也給客戶帶來不良的印象，對客戶造成不必要的干擾。近年來，監(jiān)管力度逐年上升，對電銷電話管控嚴(yán)度加大。為能有效運(yùn)營電銷就需要有特定對象，向有購買保險(xiǎn)意愿的客戶精準(zhǔn)的撥打。

隨著AI 科技的進(jìn)步，普強(qiáng) AI 建模產(chǎn)品的核心運(yùn)用了最新的 AI 語音轉(zhuǎn)譯和語義理解技術(shù)，為這樣的場景提供了一個(gè)極佳的解決方案，能夠讓 A 保險(xiǎn)公司和有類似業(yè)務(wù)場景公司的電銷人員將資源集中在有潛在購買意愿的客戶。一方面，避免撥打全量的電話，減少人力資源和電信話費(fèi)，另一方面，能有效減少對沒有購買意愿客戶的干擾。當(dāng)客戶有意愿和需求購買保險(xiǎn)時(shí)，電銷的外呼電話不被認(rèn)為是干擾；相反，對沒有購買意愿或能力的人，這樣的電話即成為客戶的干擾。

事實(shí)上，經(jīng)過AI 建模的分析，在數(shù)百萬的客戶名單中，有購買意愿的大約在 15% 左右，因此 80% 以上的電話都是不必要撥打的。這樣的應(yīng)用給 A 保險(xiǎn)公司和有類似應(yīng)用場景的公司省下巨大的成本。接下來，將會對此做詳盡的描述。

一、語音語義理解可獲取有價(jià)值的客戶特征

雖然沒有客戶的固定維度信息，但是有許多已撥打過的錄音，A 保險(xiǎn)公司擁有海量的客戶通話錄音，錄音內(nèi)含有寶貴的客戶信息、客戶特征等。這些數(shù)據(jù)都可以作為篩選客戶的依據(jù)，例如在電銷的過程中可以得知：

l買過保險(xiǎn)：“謝謝，我已經(jīng)有保險(xiǎn)了”。

l可能有車：“對不起，我正在開車，不方便講話”。

l有房人士：“我目前房貸壓力大，沒有閑錢買保險(xiǎn)”。

還有許多類似的特征都可以從電銷人員和客戶的通話中獲取，做成客戶畫像。普強(qiáng)過去積累了許多成功案例，其中就包含大量這樣有價(jià)值的客戶特征。從各樣的案例中，電銷人員重點(diǎn)關(guān)注擁有這些特征的客戶，撥打給這類有較高意愿的客戶并提高銷售力度，增加撥打次數(shù)和跟進(jìn)，從而提升銷售成交率。因此，若能將這些寶貴的客戶信息特征挖掘出來，也就能更進(jìn)一步找出潛在客戶，從而將電銷團(tuán)隊(duì)的大量資源（人力、時(shí)間、電話費(fèi)用……）做最有效的運(yùn)用，達(dá)到最大收益。

二、AI語音轉(zhuǎn)譯和語義理解

自從2010 年蘋果電腦、手機(jī)發(fā)布 Siri 應(yīng)用后，語音識別技術(shù)不斷的更新、突破。其主要是源于一種計(jì)算機(jī)算法架構(gòu)的技術(shù)突破：深度神經(jīng)網(wǎng)絡(luò)。使用神經(jīng)網(wǎng)絡(luò)的技術(shù)，研究人員不斷推進(jìn)許多人工智能以前不能突破的障礙，例如語音識別、圖像識別、語義理解等三大領(lǐng)域。借助神經(jīng)網(wǎng)絡(luò)架構(gòu)，這些領(lǐng)域里的問題都大大提升了應(yīng)用上的效果。這樣的突破主要由以下幾個(gè)因素造成：

l數(shù)據(jù)量徒增：借著互聯(lián)網(wǎng)的發(fā)展，大量的用戶將語音、圖像、照片、文字上傳到大型的數(shù)據(jù)中心。

l大型云計(jì)算中心超級的運(yùn)算能力：能儲存、處理、分析這些海量的數(shù)據(jù)。

l算法突破：借助前兩項(xiàng)，算法得以不斷的被驗(yàn)證、優(yōu)化、迭代更新，創(chuàng)新的神經(jīng)網(wǎng)絡(luò)架構(gòu)不斷的被提出并被驗(yàn)證。

在語音識別方面，2017 年微軟研究院的技術(shù)達(dá)到了與人翻譯的結(jié)果相同的里程碑。在電話對話的數(shù)據(jù)集（Switchboard），微軟的研究員們使用了多個(gè)神經(jīng)網(wǎng)絡(luò)模型來翻譯使結(jié)果達(dá)到最優(yōu)，翻譯的字錯誤率與4位專業(yè)翻譯人士共同翻譯的錯誤率基本相同。2018 年谷歌的 DeepMind 使用了大型的 CNN-RNN-CTC 神經(jīng)網(wǎng)絡(luò)架構(gòu)，翻譯結(jié)果比翻譯專家好六倍。同時(shí)在圖像識別方面，也同樣有重大突破，使得自動駕駛這樣復(fù)雜的工作，變得可實(shí)現(xiàn)。

語音、圖像識別持續(xù)突破，在語義理解方面，使用神經(jīng)網(wǎng)絡(luò)架構(gòu)的算法也突破了人的水平。著名的史丹佛大學(xué)語義理解競賽的文本問答數(shù)據(jù)集，內(nèi)有10 萬條問答，都是從維基百科摘選的文章片段，然后對每一片段由真人提出問題，并在文章片段內(nèi)找出答案的位置。準(zhǔn)確率由 2017 年前的 60% 迅速攀升到最新的 90% 以上，遠(yuǎn)遠(yuǎn)超過人的水平，人的水平為 86.8%，而準(zhǔn)確率最高的神經(jīng)網(wǎng)絡(luò)是 94.6%。它所使用的神經(jīng)網(wǎng)絡(luò)架構(gòu)為一種稱為 Transformer 的網(wǎng)絡(luò)，疊加 24 次，形成一個(gè)深度大型的網(wǎng)絡(luò)（BERT），并使用了兆級數(shù)量的詞匯做訓(xùn)練。在其它常用的語義任務(wù)上，神經(jīng)網(wǎng)絡(luò)也都極大的提升了準(zhǔn)確率，例如命名實(shí)體識別（NER）、關(guān)系識別、文本蘊(yùn)含（text entailment）等。

這些人工智能的科技突破，讓許多以往計(jì)算機(jī)不能應(yīng)用到的場景成為新的應(yīng)用。在語音方面，企業(yè)存儲的海量錄音，以往是黑盒子，無法進(jìn)行分析整理。不像結(jié)構(gòu)化的數(shù)據(jù)，使用大型的數(shù)據(jù)庫，可以做查詢、統(tǒng)計(jì)、分析、圖表化等工作。如今，可以經(jīng)由語音識別成為文字，然后再經(jīng)由語義理解做分析，產(chǎn)生實(shí)際的應(yīng)用效益。接下來將對最新的語音、語義技術(shù)在人工智能科技的應(yīng)用作案例分析。

三、語音語義分析現(xiàn)行科技狀況

語音識別相對比較容易理解和定義，其任務(wù)就是將聲音轉(zhuǎn)成文字，而轉(zhuǎn)化的效果可以簡易的用字錯誤率來界定。但是識別的準(zhǔn)確率與諸多因素相關(guān)，可以用人的體驗(yàn)來做比喻，因?yàn)槿斯ぶ悄芑揪褪悄７氯说闹悄埽?/p>

l專業(yè)領(lǐng)域：如果在一個(gè)不同的專業(yè)領(lǐng)域，例如醫(yī)學(xué)，許多的用語不是一般常用的，一個(gè)非醫(yī)學(xué)專業(yè)的人士不容易理解這些醫(yī)學(xué)的用語，做文字轉(zhuǎn)化的也會出錯。

l口音/方言：嚴(yán)重的方言口音或是方言。

l傳播媒介：如電話信道。

l背景聲音：如吵雜的環(huán)境。

這些都會影響識別的結(jié)果，就像人需要時(shí)間適應(yīng)后才能聽懂一個(gè)新環(huán)境里的對話交流。所以要降低語音轉(zhuǎn)譯的錯誤率，必須要能對專業(yè)或應(yīng)用領(lǐng)域有足夠的認(rèn)識，熟悉地域的口音、方言等。

普強(qiáng)的語音轉(zhuǎn)譯專注于固定領(lǐng)域來積累領(lǐng)域的專業(yè)話語，也同時(shí)積累了大量的語音覆蓋了口音、方言、傳播媒介特性、背景聲音等因素，來優(yōu)化語音轉(zhuǎn)譯的正確率。

另一方面，語義理解任務(wù)相對的就比較不容易定義和理解，有一組學(xué)術(shù)界定義的語義理解相關(guān)的問題（GLUE）：

lCoLA：單句的二分類問題, 判斷一個(gè)英文句子在語法上是不是可接受的。

lSST-2：單句的二分類問題, 句子的來源于人們對一部電影的評價(jià), 判斷這個(gè)句子的情感。

lMRPC：句子對來源于對同一條新聞的評論，判斷這一對句子在語義上是否相同。

lSTS-B：這是一個(gè)類似回歸的問題，給出一對句子，使用 1~5 的評分評價(jià)兩者在語義上的相似程度。

lQQP：這是一個(gè)二分類數(shù)據(jù)集，目的是判斷兩個(gè)來自于 Quora 的問題句子在語義上是否是等價(jià)的。

lMNLI-m：語型內(nèi)匹配。推斷兩個(gè)句子是意思相近, 矛盾，還是無關(guān)的。

lMNLI-mm：跨語型匹配。推斷兩個(gè)句子是意思相近，矛盾，還是無關(guān)的。

lQNLI：也是一個(gè)二分類問題，兩個(gè)句子是一個(gè)(question,answer)對，正樣本為 answer 是對應(yīng)question的答案，負(fù)樣本則相反。

lRTE：是一個(gè)二分類問題，類似于 MNLI, 但是數(shù)據(jù)量少很多。

lWNLI：推斷兩個(gè)句子是意思相近，矛盾，還是無關(guān)的。

lAX：QA型圖像數(shù)據(jù)庫。

這些任務(wù)都有許多應(yīng)用場景，但是語義理解的應(yīng)用范疇也有很多不能直接應(yīng)用這些任務(wù)，例如從一段對話文本中來判斷一個(gè)人是否結(jié)婚，如下面的對話：

A：您好，我想跟您談下我們公司最近的一個(gè)產(chǎn)品的活動，這個(gè)產(chǎn)品能夠......

B：嗯，謝謝，不過我需要和我老婆商量商量....

明顯的從這段對話里，可以判定B是已經(jīng)結(jié)過婚的人。再例如，服務(wù)業(yè)里常有禁忌的用語如：

A-先聽我說or A-是誰說or A-怎么知道or A-誰告訴你or A-有沒有搞錯or A-你弄錯了or A-說重點(diǎn)or A-你必須or A-本來應(yīng)該or A-這個(gè)部門很差勁or A-這個(gè)部門差勁or A-到底需要不需要or A-你不要跟我喊or A-你明白了嗎or A-那您覺得呢or A-我說的很清楚了or A-剛才不是對你說了

這樣的語義理解應(yīng)用均不是GLUE 里面的任務(wù)能夠直接應(yīng)用的，并且在 GLUE 里表現(xiàn)良好的神經(jīng)網(wǎng)絡(luò)架構(gòu)也不能保證在真實(shí)應(yīng)用的場景里達(dá)到產(chǎn)生業(yè)務(wù)價(jià)值的效果。

2018 年底，谷歌發(fā)布了一種神經(jīng)網(wǎng)絡(luò)架構(gòu) BERT，一種基于 Transformer 架構(gòu)的多層疊加的神經(jīng)網(wǎng)絡(luò)，BERT 提出兩種版本，基本版（BASE）和大型版（LARGE），參數(shù)如下：

BERTBASE: L=12, H=768, A=12, Total Parameters=110M

BERTLARGE: L=24, H=1024, A=16, Total Parameters=34

使用了3.3Giga 的詞匯作預(yù)訓(xùn)練，然后再按任務(wù)作微調(diào)訓(xùn)練，硬件使用了谷歌 TPU V2.0 的處理器，BERT 的基礎(chǔ)版（BASE）需要 16 個(gè) TPU 芯片，BERT 的 LARGE 版使用了 64 個(gè) TPU 芯片，預(yù)訓(xùn)練需要 4 天。

在GLUE 的許多任務(wù)上均優(yōu)于此前的神經(jīng)網(wǎng)絡(luò)架構(gòu)（如上表所列）。BERT 在語音識別和圖像識別突破后帶來了語義理解的突破。此后在 BERT 的基礎(chǔ)上，在語義理解的許多應(yīng)用上都帶來了突破。然而由于 BERT 和后續(xù)的神經(jīng)網(wǎng)絡(luò)都需要龐大的計(jì)算資源和時(shí)間，給私有化部署的應(yīng)用帶來高昂的成本，除非能夠使用云端共享的 BERT 計(jì)算資源。由于數(shù)據(jù)保密的要求，許多應(yīng)用的數(shù)據(jù)無法上傳到云端，例如金融業(yè)的客戶數(shù)據(jù)等。

如前所述，這樣的科技還需要經(jīng)過再創(chuàng)新才能應(yīng)用在實(shí)際的商業(yè)場景里。普強(qiáng)在這個(gè)方面做了十年的科研投入，不斷的將最新的科技應(yīng)用在實(shí)際的商業(yè)場景上。

四、普強(qiáng)語音語義框架

當(dāng)前人工智能算法均屬在高維度的空間中尋找線性/非線性復(fù)合函數(shù)的最優(yōu)值點(diǎn)，其最核心的架構(gòu)設(shè)計(jì)實(shí)為設(shè)計(jì)此高維度空間里的數(shù)學(xué)復(fù)合函數(shù)，許多的復(fù)合函數(shù)/神經(jīng)網(wǎng)絡(luò)框架都在不同的任務(wù)中被驗(yàn)證有應(yīng)用的效益，下面列舉了幾個(gè)重要的類別：

全聯(lián)多層的神經(jīng)網(wǎng)絡(luò)：每層的神經(jīng)元均與下一層的所有神經(jīng)元相連，邏輯回歸等算法均使用此種網(wǎng)絡(luò)。

l卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks, CNN）：是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)（Feedforward Neural Networks），是深度學(xué)習(xí)（deep learning）的代表算法之一。卷積神經(jīng)網(wǎng)絡(luò)具有表征學(xué)習(xí)（representation learning）能力，能夠按其階層結(jié)構(gòu)對輸入信息進(jìn)行平移不變分類（shift-invariant classification），因此也被稱為“平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)（Shift-InvariantArtificial Neural Networks, SIANN）。卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)在視覺辨識里達(dá)到了極優(yōu)的效果。

l循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network, RNN）：是一類以序列（sequence）數(shù)據(jù)為輸入，在序列的演進(jìn)方向進(jìn)行遞歸（recursion）且所有節(jié)點(diǎn)（循環(huán)單元）按鏈?zhǔn)竭B接的遞歸神經(jīng)網(wǎng)絡(luò)（recursive neural network）。循環(huán)神經(jīng)網(wǎng)絡(luò)的研究始于二十世紀(jì) 80-90 年代，并在二十一世紀(jì)初發(fā)展為深度學(xué)習(xí)（deep learning）算法之一，其中雙向循環(huán)神經(jīng)網(wǎng)絡(luò)（Bidirectional RNN, Bi-RNN）和長短期記憶網(wǎng)絡(luò)（LongShort-Term Memory networks，LSTM）是常見的的循環(huán)神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)具有記憶性、參數(shù)共享并且圖靈完備（Turing completeness），因此在對序列的非線性特征進(jìn)行學(xué)習(xí)時(shí)具有一定優(yōu)勢。循環(huán)神經(jīng)網(wǎng)絡(luò)在自然語言處理（Natural Language Processing, NLP），例如語音識別、語言建模、機(jī)器翻譯等領(lǐng)域有應(yīng)用，也被用于各類時(shí)間序列預(yù)報(bào)。引入了卷積神經(jīng)網(wǎng)絡(luò)（Convoutional Neural Network,CNN）構(gòu)筑的循環(huán)神經(jīng)網(wǎng)絡(luò)可以處理包含序列輸入的計(jì)算機(jī)視覺問題。

lTransformer神經(jīng)網(wǎng)絡(luò)：拋棄了傳統(tǒng)的 CNN 和 RNN，整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)完全是由 Attention 機(jī)制組成。更準(zhǔn)確地講，Transformer 由且僅由 Self-Attenion 和 Feed Forward NeuralNetwork 組成。一個(gè)基于 Transformer 的可訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以通過堆疊 Transformer 的形式進(jìn)行搭建，作者的實(shí)驗(yàn)是通過搭建編碼器和解碼器各6層，總共12層的 Encoder-Decoder，并在機(jī)器翻譯中取得了 BLEU 值得新高。

lCTC（Connectionis ttemporal classification）：傳統(tǒng)的語音識別的聲學(xué)模型訓(xùn)練，對于每一幀的數(shù)據(jù)，需要知道對應(yīng)的 label 才能進(jìn)行有效的訓(xùn)練，在訓(xùn)練數(shù)據(jù)之前需要做語音對齊的預(yù)處理。而語音對齊的過程本身就需要進(jìn)行反復(fù)多次的迭代，來確保對齊更準(zhǔn)確，這本身就是一個(gè)比較耗時(shí)的工作。與傳統(tǒng)的聲學(xué)模型訓(xùn)練相比，采用 CTC 作為損失函數(shù)的聲學(xué)模型訓(xùn)練，是一種完全端到端的聲學(xué)模型訓(xùn)練，不需要預(yù)先對數(shù)據(jù)做對齊，只需要一個(gè)輸入序列和一個(gè)輸出序列即可以訓(xùn)練。這樣就不需要對數(shù)據(jù)對齊和一一標(biāo)注，并且CTC 直接輸出序列預(yù)測的概率，不需要外部的后處理。

以上僅就目前人工智能應(yīng)用領(lǐng)域里經(jīng)常使用并產(chǎn)生實(shí)際應(yīng)用效益的網(wǎng)絡(luò)做了簡介，當(dāng)應(yīng)用到各個(gè)實(shí)際場景里時(shí)，還有基于上述網(wǎng)絡(luò)衍生的眾多版本和彼此之間的結(jié)合版，不能一一詳述。

深度學(xué)習(xí)里的神經(jīng)網(wǎng)絡(luò)架構(gòu)及其參數(shù)和超參數(shù)均需按實(shí)際場景和數(shù)據(jù)的情況作調(diào)試優(yōu)化，方能達(dá)到理想的效果以產(chǎn)生實(shí)際應(yīng)用價(jià)值。然而實(shí)際的場景雖然都有相似之處，但也有諸多不同的細(xì)節(jié)，為能滿足每一應(yīng)用場景的應(yīng)用效益要求，以過往往需要由資深的算法工程師做深度的調(diào)試，此種模式耗時(shí)且效率低，常常不能滿足客戶快速的迭代需求。

大型人工智能科技公司提倡將大量的數(shù)據(jù)存儲在它們的云計(jì)算平臺上，并同時(shí)按采集到的海量數(shù)據(jù)調(diào)試一個(gè)能廣泛應(yīng)用的平臺。此種商業(yè)模式，雖有可行性，但同時(shí)也面臨著一些根本的挑戰(zhàn)。例如如何能保證數(shù)據(jù)的安全，特別是金融行業(yè)和其它對數(shù)據(jù)保密要求高的行業(yè)，同時(shí)這些大型的人工智能公司現(xiàn)今也不斷的擴(kuò)張他們的業(yè)務(wù)領(lǐng)域，將數(shù)據(jù)提供給此類的云平臺，也加速了他們的競爭力來切入不同的商業(yè)領(lǐng)域，這樣的擔(dān)憂也是使得這樣的方法無法獲得更多商業(yè)應(yīng)用的數(shù)據(jù)，從而不能提供一個(gè)通用的應(yīng)用人工智能系統(tǒng)。

據(jù)此普強(qiáng)提出發(fā)展一種可重復(fù)復(fù)用的機(jī)制，將這個(gè)機(jī)制靈活的應(yīng)用到每一個(gè)客戶業(yè)務(wù)場景上，當(dāng)這個(gè)機(jī)制應(yīng)用到特定場景上時(shí)，會按已成功的案例，做梳理業(yè)務(wù)邏輯并同時(shí)在客戶內(nèi)的私有云上采集數(shù)據(jù)，再用成功案例的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)，機(jī)器學(xué)習(xí)算法架構(gòu)來訓(xùn)練、測試、驗(yàn)證模型，最終上線運(yùn)行業(yè)務(wù)邏輯，提升業(yè)務(wù)價(jià)值及效益。這樣的機(jī)制主要包含兩項(xiàng)重要元素，方法論和計(jì)算技術(shù)框架：

l方法論：對行業(yè)及業(yè)務(wù)場景整理出流程和規(guī)則，并按此流程和規(guī)則采集積累海量的數(shù)據(jù)。

l計(jì)算技術(shù)框架：按實(shí)際應(yīng)用場景，建立算法框架，框架是由各類已驗(yàn)證后的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法構(gòu)成的體系，對每一應(yīng)用場景作全框架計(jì)算測試評估，研判出最優(yōu)的神經(jīng)網(wǎng)絡(luò)架構(gòu)和機(jī)器學(xué)習(xí)算法，并同時(shí)調(diào)試參數(shù)和配置。

普強(qiáng)在金融及相關(guān)領(lǐng)域，積累十年以上的人工智能行業(yè)落地經(jīng)驗(yàn)，專注于垂直領(lǐng)域，歸納成功的案例、相關(guān)的業(yè)務(wù)流程規(guī)則和算法算力需求，建立起一套完整的機(jī)制。隨著客戶的業(yè)務(wù)需求變化和成功案例積累，不斷的擴(kuò)充加強(qiáng)優(yōu)化此機(jī)制，作快速的迭代。

五、成功案例分享

A保險(xiǎn)公司為名列世界500強(qiáng)的保險(xiǎn)公司（在本文開頭已有提及），普強(qiáng)將語義分析機(jī)制應(yīng)用在A保險(xiǎn)公司的電銷業(yè)務(wù)里，項(xiàng)目一期應(yīng)用在A保險(xiǎn)公司兩個(gè)主要的業(yè)務(wù)區(qū)：BJ市和TJ市。對大約250萬的客戶電銷通話錄音（約400萬通錄音）作落地實(shí)施，其中包括了下列的步驟：

l業(yè)務(wù)梳理：與客戶業(yè)務(wù)人員交流，以對客戶的業(yè)務(wù)做深度的了解，與普強(qiáng)機(jī)制框架對接。

l分析流程建立：分析客戶業(yè)務(wù)，建立流程，優(yōu)化流程。

l客戶特征篩選：基于普強(qiáng)的業(yè)務(wù)成功案例，使用大數(shù)據(jù)分析，抽取潛在具有購買意愿客戶特征。

l成交相關(guān)度計(jì)算：經(jīng)由普強(qiáng)大數(shù)據(jù)分析框架計(jì)算客戶特征與成交的相關(guān)度，排序客戶特征的優(yōu)先順序。

l模型建模/訓(xùn)練：普強(qiáng)計(jì)算技術(shù)框架對最優(yōu)最先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu)和機(jī)器學(xué)習(xí)算法，作架構(gòu)和算法評估，測試不同架構(gòu)和算法的效益優(yōu)劣，及計(jì)算資源需求以及是否能達(dá)到客戶的時(shí)效要求等工作，最終推薦最優(yōu)的架構(gòu)/算法。

l測試：使用海量的數(shù)據(jù)不斷的測試，并調(diào)優(yōu)參數(shù)，達(dá)到準(zhǔn)確率、召回率等測試標(biāo)準(zhǔn)的要求，并依照業(yè)務(wù)模式計(jì)算相對的業(yè)務(wù)效益。

l驗(yàn)證：實(shí)際推送普強(qiáng)業(yè)務(wù)流程算法推薦的潛在客戶，驗(yàn)證成交率。

l上線：將最終驗(yàn)證通過的整體機(jī)制上線，進(jìn)入實(shí)際業(yè)務(wù)運(yùn)行。

與使用普強(qiáng)機(jī)制前業(yè)務(wù)情況對比的成效如下：

l精準(zhǔn)的推薦占總量約15% 的潛在有購買意愿的優(yōu)質(zhì)客戶。

l推薦的15% 的客戶覆蓋了 90% 的業(yè)績。

l節(jié)省了80%+ 的電銷電話，人員時(shí)間。

l并減少了對沒有意向購買客戶的干擾。

l確定了潛在購買客戶的特征，作話術(shù)優(yōu)化的依據(jù)，有定向的與客戶對話以確認(rèn)是否是有所確定的特征。

l發(fā)掘了電銷流程的缺失：發(fā)現(xiàn)高購買意向客戶的跟蹤力度不及時(shí)或遺漏的情況，建立追蹤系統(tǒng)及時(shí)找回遺漏的潛在客戶并跟進(jìn)。

六、結(jié)語

隨著計(jì)算力和云存儲容量的大幅提升，海量數(shù)據(jù)的收集，使得以往不能突破的人工智能問題均得到突破：如語音識別、圖像識別、語義理解等領(lǐng)域。借著這些突破，許多商業(yè)場景都能應(yīng)用這些最新的人工智能突破，而產(chǎn)生實(shí)際的商業(yè)效應(yīng)。

本文中敘述了語音識別和語義理解在特定的垂直領(lǐng)域中的應(yīng)用，并詳述案例和其應(yīng)用的效益。此種效應(yīng)隨著科技的進(jìn)步和突破，必能擴(kuò)及更多的場景和商業(yè)應(yīng)用。本文中所述的方法論和技術(shù)計(jì)算框架也必定會不斷的迭代更新和擴(kuò)充，帶給實(shí)際的業(yè)務(wù)更多的效益。

深度 | AI 建模實(shí)際應(yīng)用場景及效益

相關(guān)閱讀