高性能計算集群(英語:High-PerformanceComputingCluster,簡稱HPCC),也被稱為數據分析超級計算機,是一個由律商聯訊風險解決方案發展的開放源代碼數據密集型計算系統平臺。
HPCC(高性能計算集群)也稱為DAS(數據分析超級計算機),是由LexisNexis風險解決方案開發的開源,數據密集型計算系統平臺。HPCC平臺整合了在商品計算集群上實現的軟件架構,為使用大數據的應用程序提供高性能的數據并行處理。HPCC平臺包括支持并行批處理數據處理(Thor)和使用索引數據文件(Roxie)的高性能在線查詢應用程序的系統配置。HPCC平臺還包含一個以數據為中心的并行數據處理聲明性編程語言ECL。
HPCC系統體系結構包括兩個不同的集群處理環境,每個集群處理環境都可以獨立進行優化,以實現并行數據處理目的。這些平臺中的第一個被稱為數據精煉廠,其總體目的是用于任何目的的大量的任何類型的原始數據的一般處理,但通常用于數據清理和衛生,提取,轉換,原始數據的加載處理,記錄鏈接和實體解析,大規模特設的復雜分析以及創建鍵控數據和索引以支持高性能結構化查詢和數據倉庫應用程序。數據精煉廠也被稱為Thor,這個大錘象征著把大量的原始數據壓縮成有用的信息。Thor集群的功能,執行環境,文件系統和功能與Google和Hadoop MapReduce平臺類似。