當前位置:首頁 > 軟件與服務 >

思邁特軟件副總裁徐晶:數據挖掘加持下,商業智能的未來發展趨勢

發布時間:2019-11-15 16:27:55 來源:中國軟件網 作者:emon
[摘要]11月14日,由中國軟件網主辦,海比研究、光明網聯合主辦的“洞見2020中國企業服務年會”在北京香格里拉飯店隆重開幕。
  11月14日,由中國軟件網主辦,海比研究、光明網聯合主辦的“洞見2020中國企業服務年會”在北京香格里拉飯店隆重開幕。思邁特軟件副總裁徐晶出席會議并發表主題演講。以下為演講全文:
  

  徐晶(思邁特軟件副總裁):各位中國軟件網的朋友曹總,尊敬的同行,很高興有這個機會,分享一些自己個人的觀點。我的PPT整理的比較簡單,希望大家有一些啟發,最后希望大家能夠記住我們這個品牌,Smartbi。

  我特別想感謝一下我們攝影師,我們這個團隊,能把我馬上變得這么高大上,而且能瘦一點。

  我們公司名字叫做思邁特軟件,是廣州的一家公司。今天正好是我們八周年生日,下午我們公司有很多活動。我們公司成立八年以后,客戶群有三大類:

  一、金融類客戶。

  包括中國銀行、民生銀行、泰康人壽、中信證券等等。

  二、企業類客戶。

  占我們大概1/3。

  三、政府類客戶。

  我們的客戶比較多,我就不說了,二維碼可以掃描一下。既然我的題目《數據挖掘對商業智能未來的影響》,我想商業智能首先這個概念,先表達一下自己的理解。因為我自己從畢業到現在一直在做BI的工作,我對它的理解分為三層:

  第一層:數據準備。

  我們做BI很久以前,都是從ETL開始,數據準備現在成為BI的一個標配。

  第二層:數據分析。

  第三層:這個環節里可以有很多種做法,我先拋到后面去說。中間有三層不同的類型。最后做完數據分析,有一個應用,這種應用有很多方式(共享、報告、交流、協同),都屬于共享,這是BI大方面包含的哪些內容。

  概念介紹完以后,我們再看看為什么現在說BI?因為我已經說了十幾年,我之前很多人還在講BI,這個詞為什么還這么火,我們看看數據就知道了。

  Gartner大家都很了解,今年初做過一項全球統計,大家愿意把錢預算花到哪里去?這個表不知道有沒有見過。我解讀一下,就是說CIO很多地方可以投資,增加預算,在什么地方增加預算最多呢?就是在BI和數據分析上。有45%(將近一半)的CIO,都愿意在上面增加預算。這說明數據分析對于企業來說是多么關鍵。

  第二個數據,IDC。全球在這個領域上整體的業務規模多大?有24個。就這么大一個盤子,還以10%的速度在增長。我們國內速度更快,中國的BI市場增長,年增長在30%左右,這是幾個外部機構第三方評估出來的。未來我們可以達到百億規模,BI領域還是非常、非常熱。

  熱,我覺得要冷靜思考一下,我想說自己的觀點。我怎么思考呢?很冷靜。它肯定屬于一個增長,如果是說現在數據分析或者BI,能夠滿足客戶需要了,還會增長嗎?我覺得就要平靜了。之所以有這樣一個高速增長,說明我們現在還沒有滿足客戶的需求,這是顯而易見的。

  在這個情況下,新技術、新產品、新概念,應該說是層出不窮。從我畢業到現在經歷了好多、好多概念的沖擊,我想梳理一下,還是用比較權威的一種概念分類:傳統BI、自助BI和智能BI,這三個階段從暴露的所有文章來看和報告來看,都是從左向右的關系。這是一個替換的關系嗎?我覺得需要在里面進行思考,為什么會這么提?

  這個細節大家注意,這個圖里面后面包含兩個虛線,我也在思考為什么出現這樣一個設計,這是我今天演講的關鍵。BI在干什么樣的事情,其實解決讓企業里的更多人,去用到數據分析,能享受數據分析帶來的結果(價值)。

  再一個,能夠真正給我提供很深度的,滿足我的深度要求。我們二象限分開,一個水平、一個垂直,可以看很清楚了。傳統BI,剛才是一個水平線的三個階段,我們重新來看。

  傳統BI,在人比較少的應用。因為一般來說,傳統BI都由第三方定制開發出來,是給領導看的,用的人比較少,所以在象限的左側。深度呢?應該說用的還不錯,并不是那么高。我們用這個思維來看,自助BI或者智能BI放在什么地方呢?我放在這個位置,會什么會放得稍微靠下一點呢?為什么放在右邊一點呢?因為自助讓業務人員來用,業務人員自己來做數據分析(報表、圖形、儀表盤)。你可能把一個比較復雜的計算公式扔給業務人員去算嗎?按技術來說,我們比較強大的能力會賦予業務人員呢?不可能的。有興趣的可以聊我們現在大客戶用到自助分析的已經碰到一些問題了。

  也就是說,能滿足自助分析的程度比較低,能做的事很簡單,可以讓更多人用到。你們注意中間這個車了沒有?這個細節很有意思。

  剛才說傳統BI是由第三方開發出來的東西,像不像我們去打,網約車,讓別人給我開車。自助BI正好是我們自己開車,自駕車、私家車,更多人掌握這個能力以后,可以自己開車了,這個比喻是非常有意思的。

  智能BI呢?剛才說數據挖掘會把商業智能引到哪里去?我想智能BI肯定往一個好的方向(右上角)越靠右邊越好,怎么理解呢?首先,我們先把這個概念拋開,不是說一定的數據挖掘,我們應該說人工智能或者AI。

  首先,智能化要向右邊發展,讓更多人去用,怎么才能用起來呢?要降低操作門檻,這里有一個小的視頻,是不是能播出來?我們試一下。

  (播放視頻)

  這是我們為了讓更多的業務人員用自然語言交互的方式,擺脫鼠標來進行數據分析,我們的一種探索,這個界面錄像是兩年之前,我們領導的一個女兒配的音,挺有意思。

  還有一種方式是數據挖掘,既然提到數據挖掘,肯定有人會知道數據挖掘是什么東西,要去建模的。建模的過程,在以前傳統BI的時候誰做呢?必須有一個數據挖掘的團隊幫你做。

  現在怎么做呢?現在由業務人員和我們的技術顧問坐在一起,一步一步進行數據分析來做數據建模。這里有一個小的錄像,可以放一下。

  (播放視頻)

  這個沒有聲音,就是一個操作過程,非常簡單。我們在每一步都可以對它進行數據檢查,輸出結果,你可以操作執行的每一步,對里面的算法每一個進行調整,整個過程都是可視化的方式完成,這就降低了操作門檻。只有這樣才能在象限里盡量靠右,讓更多人去用它。

  第二個方向,既然是一個象限,向右我們知道怎么做了。向上呢?怎么變得更強大一點呢?我們要深度挖掘數據本身的價值。

  一是算法層面,各種各樣的算法要變得更可配置、更組件化,更好去設置,這是一方面。我就不說了,咱們常見的算法都在這邊。

  二是讓我們建模過程,也能變得更加智能,更方便。我們在某一個組件的配置上,算法配置上,能不能自動優化參數。咱們知道,算法最重要是參數。參數是很重要的事情,來回調。如果系統自動幫你調好呢?這是第一。

  第二,數據挖掘產生的很多模型,這個模型能不能被下次別人所用呢?這些問題阻礙數據挖掘能夠普及的一些關鍵問題。我們希望這方面進行嘗試。

  可以說從兩個緯度向右邊,更多人用起來;向上邊,變得更智能。我自己感覺,經過了30多年BI這個詞以前,以前的那個I,終于現在開始變得智能一點了。因為在這之前,基本上我們看到都還是報表,可視化的儀表盤,其實都還是報表,都是一些統計的東西,缺乏智能化。只有剛才我給大家描述的那種,變得更加成熟以后,我們就真正智能起來了。

  那剛才我在前面比喻的時候,用到了私家車的概念,我們打車變成私家車(未來還有智能駕駛),但未來一定是只有智能駕駛嗎,我們可以想一下現在智能交通未來會把大家私家車全部收走嗎,你會叫不到車嗎。我想是不會的,未來這個時代是智能時代,但他一定是包容的。他會讓各種各樣的人都在上面能夠找到自己的位置,去選擇自己想要的結果或者工具。

  其實BI也是一樣的,未來的智能化的BI,他不是只有一個選擇,就只是你說話就可以完成。他一定是承載各種各樣的東西在上面的,所以我們也做了一些自己的探索、摸索,我們看看是不是以中臺的方式提還是更合適。那我這里面提的一個關鍵字叫做數盡其用,人盡其才。

  用思路、思想能把我們所有的功能、工具整合在一起,那包括剛才說的上面三個方面,一個是數據準備的方面,怎么訪問數據,怎么去關聯數據,像目前BI的發展,前面浪潮的也說了,我們數據在保留現在的規格之上,就可以馬上進行關聯數據分析,未來也是一樣。

  不是說你一定需要一個很健全的數據參物才能做數據分析,他是什么時候都可以基于數據源開始的。他的數據訪問能力非常的強,而且自帶數據處理的能力,像剛才我們在一個流式數據分析的建模的過程中,都可以做數據處理,包括嵌入自己的語句進行處理都是可以的。

  當然還允許用戶自己做數據提取封裝,第二層面就是數據分析。數據分析的話,用網上那種比較含糊的概念就是我們可以做報表,我們可以做數據可視化,我們可以做各種各樣的鉆取分析,下鉆上鉆,我們還可以做數據挖掘,這些都應該屬于數據分析層所解決的問題。

  剛才我T形圖里面,最起碼用報表來表述,用分析的方式去切割,去找到原因,用一種挖掘的方式去預測未來,這三個層面的需求都應該在這個階段完成,這是數據分析。最后我們還要把他去很好的暴露出來,分享出來,這個是很重要的。

  數據準備的話,我們要做哪些事情。為了數據質量能夠足夠多,足夠用,不斷去訓練他的功能讓他變得更方便,能把數據你原始的東西抓過來進行整理。然后還可以類似資產管理一樣提供導航。你能知道,讓用戶能知道,讓每個業務人能知道,很快能找到自己的數據在哪。我要的數據系統里有沒有,這些東西都應該是準備工作去完成的,沒有這些前提,后面所有的數據分析可視化、數據挖掘都是假的。

  那這個是基本基礎的工作,當然還要考慮各種性能的問題。那數據鏈接的能力要求訪問各種各樣的數據源,我們公司也剛測過,跟高斯DB一級的測試,當然用戶最重要的是可以用這樣一種可視化拖拽的界面能夠隨時對我所擁有的數據源(有權限的)進行跨戶的查詢,把兩個數據源直接放在一起進行關聯分析,讓他自己去完成。

  同時把這個查出的數據還直接扔到一個數據庫里面,我們叫數據集市,這樣的話其實我們看以前所有一個BI項目,過程中需要用到的一些數據處理、整合、數據建模的工作其實都用工具層本身就能完成,現在做得越來越多。

  數據分析的工作剛剛說了很多,我想數據分析一定是多樣的,有的人他需要,像我們銀行客戶很多,他們很多客戶都需要……或者大的客戶,集團性的客戶他們首先需要的數據明細的查詢(跟這片子沒關系,我單說的)他們需要明細數據,數據服務層面的東西我先要拿到,拿到數這個是他們第一需求,第二個需求就是我能做各種各樣的報表,這個大家都玩Excel或者都知道Excel,都知道報表是怎么回事兒。

  當然還有一種是做分析,我們可以用各種各樣的傳統的Olub去想,或者Excel表去想,這種分析的能力也非常重要,需要給用戶的交互的能力不斷的篩選,去切數據。當然我們還要考慮他的性能,我剛才說的一個性能問題,提了好幾次,我再提醒大家一下。

  剛才說的幾個階段里面,傳統BI到自主BI階段,打車變成私家車。他帶來的很大問題就是我們現在目前交通環境惡化是大量車構成的,如果只有打著那一車,公交車你會堵車嗎。不會的。在資源有限的情況下,如果大力發展所有都是私家車,一定會堵,那企業里面的數據分析也是一樣的。

  所以這個比喻非常有意思,給我們很多啟發。如果我們在企業里面真的讓業務人員,應該叫肆無忌憚的去做透支分析或者各種各樣的可視化分析的時候,你的系統資源會消耗得非常快,這個在我們的大客戶里面也出現過。

  那怎么去平衡數據查詢的性能,是我們特別考慮的一件事情,所以我們才會融入什么高速緩存、抽取各種各樣的概念,或者我們的功能。當然很重要的一步就是業務人員,大家能看懂的,就是拖拖拽拽能夠實現一個儀表盤的數據分析,這是一個非常非常簡單的操作。但是非常有效。

  這個目的破除了IT的瓶頸,這個大家在網上都能看到。那最后就是數據的報告,我所做的所有的數據分析或者說業務人員自己做的數據分析怎么去用。應該好多種用法,我們常見的就是在手機端上去看,這是一個必備的功能,大概在5年之前,我們的金融客戶還是考慮安全原因不上移動端,但這兩年都紛紛上移動端了,包括銀行、證券都是這樣的。

  移動端是必須的,第二就是說,大屏幕,剛才我們前面也能看到一些大屏幕,大屏幕是什么樣,我們也能看得到。當然還有一種,我們各種各樣的數據最后呈獻給領導的時候,都是放在word和PPT里面的,如果領導說你的數據不對,你需要怎么辦,或者你發現錯了怎么辦,要重新把所有的數據跑一遍,然后重新截圖過來。

  那如果說,這種數據分析的結果,數據可以一鍵刷新,是不是非常方便。所以他應該都屬于數據報告的范疇。我是舉些例子,我們就不講了。這個是比較有特色的一個案例,我們根據民生銀行的阿拉丁的項目總結出來一個思想,就是共享。

  剛才我說了私家車的問題,自助分析云越來越多,就像私家車越來越多,堵車了。堵車怎么辦,他應該去分流,他應該整合資源,比如說共享,如果我坐的車,順風車,我的車開出來,我把路線告訴別人,別人可以來搭車這樣的話,資源得到復用了,這樣路上也沒那么堵了。

  其實數據分析也是一樣的,民生阿拉丁有一個叫付信商店的一個東西,就可以讓業務人員自己的分析成果發布到這里面來,發送到了以后,讓別人可以看得到,可以點評,可以交流,他所分析的,實際上模型是一個思路,不是數據。我根據他的思路套到我的數據上面,這是我想要的結果了,他用這種分享的機制,其實化解了很多性能的壓力,我個人認為。第一是化解性能的壓力技術上角度講,第二就是他真的是促進一種文化。讓大家對數據分析形成一個共識,他很有用,我們要經常去用他,不斷去學習。這個是非常重要的。而不是說在工具本身有多好。

  這是我們公司的公眾號,我們是思邁特軟件,我們產品的名字叫SMARTBI,咱們看前面SMART,所以我們的口號叫更聰明的大數據分析軟件,快速挖掘數據價值。謝謝大家。

  (文字根據現場講話整理,未經本人審閱)

【返回首頁】

德甲积分 甘肃快3和值中奖 广西快三开奖号码 山西泳坛夺金481走势图 吉林快三开奖结果一定 今天贵州快3推荐 秒速牛牛在线预测 吉林11选5走势图 棋牌长春麻将 支付宝天天红包赛反作弊 2019上证年线 北京赛车pk计划苹果版 武汉麻将开口规则 甘肃11选5前三走势图 米牛网配资 广东十一选五开奖号 qq麻将