图形工作站、集群应用方案
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
全球领先的高端图形工作站供应商

免费测试 热线 : 400-7056-800 【 为任何应用提供 最快计算设备 如不符,退货】【最新报价】【选购指南】【京东商城】



企业通用模版网站

  • 科研团队全能超算平台25v1
  • 超高分拼接 数字孪生
  • 科学计算MatLAB工作站24
  • 地质建模 油藏模拟工作站
  • 工业CT扫描 机器视觉计算
  • 电力系统关键应用配置24
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
  • 送无人机啦 8核6.4GHz  96核4.8GHz 加速改装 

  • 高性能集群 虚拟并行计算 芯片设计 光学仿真 

  • 蛋白质预测 生物信息 冷冻电镜 材料模拟

  • RSS订阅
  • 理科计算推荐
  • 仿真计算最快最完美25v1
  • 电磁仿真单机与集群25v1
  • 航拍实景建模单机集群
  • 遥感图像处理工作站集群
  • 4K/8K剪辑特效调色24v1
  • AI大模型工作站集群25v1
  • Abaqus硬件配置大全24v3
  • CST电磁仿真工作站25v1
  • 多物理场仿真单机与集群
  • 流体/空气动力学仿真25v1
  • 量子化学 分子动力模拟
  • 三维设计24v2  3D打印

 

您的位置:UltraLAB图形工作站方案网站 > 人工智能 > 深度学习 > Xeon Phi加速处理器细节:最多61核心、300W

Xeon Phi加速处理器细节:最多61核心、300W

时间:2012-08-10 16:12:00   来源:UltraLAB图形工作站方案网站   人气:11591 作者:admin

六月份,Intel正式发布了首款基于IMC众核架构、22nm Knights Corner核心的加速处理器“Xeon Phi”,Larrabee借此重生,准备与NVIDIA Tesla、AMD Fusion等等在高性能计算领域一较高下。不过,Intel当时并未公布太多技术细节,规格上语焉不详。

上周,Intel开始向合作伙伴提供B0步进的Xeon Phi芯片样品,我们也得到了比较详细的技术参数。

昨天——

Larrabee独立显卡项目失败后,Intel并未放弃,而是捡起了“Aubrey Isle”核心与合作伙伴继续试验,而搭载此核心的扩展卡代号“Knights Ferry”,2010年三月正式亮相,并称之为“MIC”众核架构。

Aubrey Isle采用的是45nm工艺,32个核心,1MB一级缓存,8MB二级缓存,主频1.2GHz,搭载2GB GDDR5显存,位宽达到惊人的1024-bit,而且是环形总线设计,热设计功耗300W左右。

Knights Ferry扩展卡可以执行x86标准代码,能提供750GFlops的单精度浮点性能,双精度效率41-47%,也就是不到400GFlops。至于这块卡出货了多少,谁也不清楚,反正难得一见,毕竟只是个试验品。

2011年初,准备采用22nm工艺的新核心“Knights Corner”出现了,BIOS、PCB、规格都有很多版本。A0步进的有48、52、60个核心,1.5-1.9MB一级缓存,24-30MB二级缓存,显存抛弃环形总线,位宽缩减到512-bit(待确认),容量2、4、8GB GDDR5,等效频率不过2.4-4.5GHz,主频也只有1GHz,因为即便这样热设计功耗也有300W了。

60核心版本曾经演示过1TFlops的单精度浮点性能,但双精度比较惨淡,不足以成气候。

Intel随后准备继续发展B0、C1等新步进,并且计划尽快出货,以登上2013年六月的全球超级计算机五百强名单。

今天——

B0就是现在的步进版本,ES2版工程样品,进步很大,引入了一些非常必要的功能特性,BIOS也做了全面完善。

核心数量为57、60、61个(很不规整的数字),一级缓存1.8-1.9MB,二级缓存28-30.5MB,显存增加到3、6、8GB GDDR5。

Xeon Phi加速处理器细节:最多61核心、300W

频率方面有多种不同设定,57核心3/6GB显存的600-1100MHz,60/61核心8GB显存的则是630-1050/1090MHz,显存频率达到了5000-5500MHz,带宽超过300GB/s。

值得一提的是,Intel这次引入了Turbo动态加速技术,类似桌面上的睿频,但具体多少个核心能加速到什么程度不详。

热设计功耗,57核心3GB显存、60核心6GB显存的是245W,57核心6GB、61核心8GB(两种版本)的则是300W。

散热方案有主动风扇、被动静音两种,其中被动静音的用于自备大风量的机架系统,但也有完全无散热的,用于自行安装水冷等其它散热器。顺便说一句,这些卡很重很重。

Xeon Phi加速处理器细节:最多61核心、300W

具体性能没有实际数据,Intel的内部目标是单精度2TFlops、双精度1TFlops,从已知情况看难度不大。

C1步进还没出来,会是什么样子还有待观察。

再往后,还有第二代“Knights Landing”,Intel对高性能计算的追求不会停歇

关闭此页
上一篇:NVIDIA®(英伟达™)的超级开普勒GPU工作站
下一篇:异构计算:Exascale时代的新模式

相关文章

  • 05/12AMD 第 6 代 EPYC Venice:发现 CCD 配置和线程性能
  • 05/12UltraLAB定制图形工作站产品介绍2025v2
  • 05/09Xeon6代+4块GPU--图灵超算工作站GT450M介绍
  • 05/09汽车风阻测试模拟分析、算法,及服务器/工作站计算设备硬件配置推荐
  • 04/26高频交易(HFT)应用分析、算法,服务器/工作站硬件配置推荐
  • 04/25衍生品定价与风险对冲应用分析、算法,及服务器工作站硬件配置
  • 04/25量化交易策略应用算法分析、服务器工作站硬件配置
  • 04/24金融风险管理应用算法分析、服务器/工作站硬件配置推荐
  • 04/19油藏模拟软件的算法分析以及图形工作站/服务器硬件配置推荐25v2
  • 04/17大型3D设计软件CATIA-算法分析与图形工作站硬件配置

工程技术(工科)专业工作站/服务器硬件配置选型

    左侧广告图2

新闻排行榜

  • 1如何在本地运行 Llama 3 8B 和 Llama 3 70B及硬件配置推荐
  • 2NVIDIA GeForce GTX 280测试报告
  • 3比GTX280快10倍-Quadro VX200专业卡评测
  • 4深度学习训练与推理计算平台硬件配置完美选型2020v1
  • 5高性能仿真计算集群(结构、流体、多物理场耦合)配置推荐2024v1
  • 62019年最快最全深度学习训练硬件配置推荐
  • 7Llama-2 LLM的所有版本和硬件配置要求
  • 8支持7块RTX3090静音级深度学习工作站硬件配置方案2021v2
  • 9HFSS电磁仿真应用与工作站配置方案
  • 10解锁最大推理能力:深入研究80GB A100 GPU 上的Llama2–70B

最新信息

  • 性能直逼6710亿参数DeepSeek R1--- QwQ-32B推理模型本地硬件部署
  • 史上最神的AI静音工作站---算命、炒股、看病、程序设计、销售策划、仿真计算、3D设计、药物设计、基因测序、大数据分析
  • 用中文训练更快-满血版Deepseek R1本地部署服务器/工作站硬件配置精准分析与推荐
  • DeepSeek R1训练和推理一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek V3推理和训练一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek R1/V3应用-服务器/工作站/集群配置推荐
  • 生成式AI热门应用、算法及对计算机硬件配置要求
  • llama3.2本地系统+软件安装运行、主要应用、计算硬件要求、最新GPU服务器配置参考

应用导航:

工作站产品中心 京东商城 中关村商城 淘宝商城 超高分可视化商城 便携工作站商城 ANSYS CATIA Microsoft INTEL NVIDIA 网站统计

公司简介-业务咨询-招聘英才-资料下载-UM-

本网站所有原创文字和图片内容归西安坤隆计算机科技有限公司版权所有,未经许可不得转载
陕ICP备16019335号 陕公网安备61010302001314号
Copyright © 2008-2023 , All Rights Reserved

首页
热线
商城
分类
联系
顶部