近年來,數據挖掘引起了信息產業界的極大關注,其主要原因是存在大量數據,可以廣泛使用,并且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以廣泛用于各種應用,包括商務管理、生產控制、市場分析、工程設計和科學探索等。
數據挖掘,就是從大量數據(包括文本)中挖掘出隱含的、未知的、對決策有潛在價值的關系、模式和趨勢,并用這些知識和規則建立用于決策支持的模型,提供預測性決策支持的方法、工具和過程;是利用各種分析工具在海量數據中發現模型和數據之間關系的過程。這些模型和關系可以被企業用來分析風險、預測未來。
數據挖掘的目的就是從數據中“淘金”,是從數據中獲取價值的過程。數據挖掘是提供了從數據到價值的解決方案,“機器學習”是數據挖掘的基石,“建?!笔菙祿诰蜻^程中最關鍵的一個環節。
Smartbi Mining以互聯網式用戶體驗為目標的全新產品設計,極簡風格的流式建模,快速實現各種類型的數據挖掘應用,為個人、團隊和企業所做的決策提供預測性智能。
平臺具備流程化、可視化的建模界面,內置實用的、經典的統計挖掘算法和深度學習算法,這些算法配置簡單降低了機器學習的使用門檻,大大節省了成本,業務人員可通過輕松拖拉拽組件的操作,進行可視化建模,完成模型流程的搭建,并能將模型發布管理。
該平臺將機器學習系統做成更加通用的、簡單易用的平臺,可以幫助企業將相關業務輕易接入該平臺,從而幫助企業利用機器學習的手段挖掘分析企業數據和解決相關的業務問題。
圖:拖拉拽建模示例
Smartbi Mining匯集50+種數據挖掘算法組件,靈活建立業務模型流程,主要包含基本的數據特征處理、分類、聚類、關聯、回歸、深度學習算法,以及支持Java和Python算法擴展。
l 操作簡單
該平臺通過直觀易用的拖拽式操作可輕松實現數據準備,數據預處理、特征工程、模型訓練、模型預測與評估的全流程,讓用戶輕松使用機器學習技術。除此,用戶可通過對數據預處理操作、特征工程以及模型配置不同參數實現不同的任務需求。
l 豐富的數據預處理操作
該平臺支持并行化的預處理操作,并支持多種數據預處理操作,例如:合并行、去除重復值、過濾空值、增加序列號、類型轉換、隨機采樣、加權采樣、分層采樣、拆分等。
l 大量的實用算法
該平臺支持多種高效實用的機器學習算法,包含了分類、聚類、回歸等算法,其中包含了多種可訓練的模型:邏輯回歸、漸進梯度決策樹、決策樹、隨機森林、樸素貝葉斯、支持向量機、線性回歸、漸進梯度回歸樹、K均值、DBSCAN、高斯混合模型。
l 支持文本分析
面對生活中海量以文本形式存在的數據,抽取出未知的、重要的、有價值的知識,如詞頻分析,分析用戶偏好、幫助知識管理、提升客戶服務等。
l 數據可視化
該平臺提供多種可視化效果,包括數據可視化、模型可視化和模型評估結果可視化。
l 挖掘模型自學習
平臺可以自動補充新數據重新訓練,保證模型預測準確性,極大減輕運維人員的工作量。
l 模型集中管理,一鍵發布
該平臺實現對模型的集中管理,與商業智能平臺完美整合,使商業智能平臺擁有數據挖掘的功能。
體驗
聯系方式
關注我們