高性能計算集群(英語:High-PerformanceComputingCluster,簡稱HPCC),也被稱為數(shù)據(jù)分析超級計算機,是一個由律商聯(lián)訊風險解決方案發(fā)展的開放源代碼數(shù)據(jù)密集型計算系統(tǒng)平臺。
HPCC(高性能計算集群)也稱為DAS(數(shù)據(jù)分析超級計算機),是由LexisNexis風險解決方案開發(fā)的開源,數(shù)據(jù)密集型計算系統(tǒng)平臺。HPCC平臺整合了在商品計算集群上實現(xiàn)的軟件架構,為使用大數(shù)據(jù)的應用程序提供高性能的數(shù)據(jù)并行處理。HPCC平臺包括支持并行批處理數(shù)據(jù)處理(Thor)和使用索引數(shù)據(jù)文件(Roxie)的高性能在線查詢應用程序的系統(tǒng)配置。HPCC平臺還包含一個以數(shù)據(jù)為中心的并行數(shù)據(jù)處理聲明性編程語言ECL。
HPCC系統(tǒng)體系結構包括兩個不同的集群處理環(huán)境,每個集群處理環(huán)境都可以獨立進行優(yōu)化,以實現(xiàn)并行數(shù)據(jù)處理目的。這些平臺中的第一個被稱為數(shù)據(jù)精煉廠,其總體目的是用于任何目的的大量的任何類型的原始數(shù)據(jù)的一般處理,但通常用于數(shù)據(jù)清理和衛(wèi)生,提取,轉換,原始數(shù)據(jù)的加載處理,記錄鏈接和實體解析,大規(guī)模特設的復雜分析以及創(chuàng)建鍵控數(shù)據(jù)和索引以支持高性能結構化查詢和數(shù)據(jù)倉庫應用程序。數(shù)據(jù)精煉廠也被稱為Thor,這個大錘象征著把大量的原始數(shù)據(jù)壓縮成有用的信息。Thor集群的功能,執(zhí)行環(huán)境,文件系統(tǒng)和功能與Google和Hadoop MapReduce平臺類似。