Quantcast
Channel: 英特尔开发人员专区文章
Browsing all 49 articles
Browse latest View live

Image may be NSFW.
Clik here to view.

整理您的数据和代码: 数据和布局 - 第 2 部分

这两篇关于性能和内存的文章介绍了一些基本概念,用于指导开发人员更好地改善软件性能。为实现此目标,文章内容重点阐述了内存和数据布局方面的注意事项。第 1 部分介绍了寄存器使用以及覆盖或阻塞算法,以改善数据重用情况。文章从考虑数据布局以提供通用并行处理能力(与线程共享内存编程)开始,然后还考虑了基于 MPI 的分布式计算。本文扩展了在实现并行处理能力时需考虑的概念,包括矢量化(单指令多数据...

View Article


Image may be NSFW.
Clik here to view.

面向英特尔® 架构优化的 Caffe*:使用现代代码技巧

提升深度学习框架的计算性能PDF 版本作者英特尔公司 Vadim Karpusenko 博士,英特尔公司 Andres Rodriguez 博士,英特尔公司 Jacek Czaja,英特尔公司 Mariusz Moczala摘要本文将介绍一种特殊版本的深度学习框架 Caffe*(最初由伯克利愿景和学习中心 (Berkeley Vision and Learning Center,BVLC)...

View Article


Image may be NSFW.
Clik here to view.

基于英特尔® 至强 E5 系列处理器的单节点 Caffe 评分和训练

     在互联网搜索引擎和医疗成像等诸多领域,深度神经网络 (DNN) 应用的重要性正在不断提升。 Pradeep Dubey 在其博文中概述了英特尔®架构机器学习愿景。 英特尔正在实现 Pradeep Dubey 博文中勾勒的机器学习愿景,并正在着手开发软件解决方案以加速执行机器学习工作负载。这些解决方案将包含在未来版本的英特尔®数学核心函数库(英特尔®...

View Article

Image may be NSFW.
Clik here to view.

英特尔® Theano*软件优化包和英特尔® Python* 分发包入门指南

目录总结前提条件英特尔® 编译器和英特尔® 数学核心函数库 2017Python* 工具构建和安装英特尔®Theano*软件优化包验证 Theano 和 NumPy 安装性能指标评测DBN-KyotoMNISTAlexNet大型电影评论数据集 (IMDB)故障排除资源附录 A附录 B参考资料总结Theano 是 LISA实验室开发的 Python*...

View Article

Image may be NSFW.
Clik here to view.

英特尔® 高级矢量扩展指令集简介

作者 Chris Lomont下载文章下载 英特尔® 高级矢量扩展指令集简介 [PDF 1.4MB]英特尔® 高级矢量扩展指令集(英特尔® AVX)是在英特尔® 架构 CPU 上执行单指令多数据 (SIMD) 运算的指令集。这些指令添加了以下特性,对之前的 SIMD 产品——MMX™ 指令和英特尔® 数据流单指令多数据扩展指令集(英特尔® SSE)进行了扩展:将 128 位 SIMD 寄存器扩展至...

View Article


Image may be NSFW.
Clik here to view.

英特尔® MKL-DNN:第一部分 – 库的概述和安装

简介目前,在大型数据集、高度并行化的处理能力和增强设备智能性的需求的推动下,深度学习成为了计算机科学领域最受关注的热点话题之一。根据维基百科的描述,深度学习是机器学习 (ML) 的一个子集,由模拟高级别数据抽象的算法构成。如图 1 所示,机器学习是人工智能 (AI) 的一个子集,人工智能的研究范围非常广泛,其目标是开发模拟人类智能的计算机系统。图...

View Article

Image may be NSFW.
Clik here to view.

英特尔® MKL-DNN:第二部分 – 代码示例创建与详解

简介在第一部分,我们介绍了面向深度神经网络的英特尔® 数学核心函数库(英特尔® MKL-DNN),MKL-DNN 是一款面向深度学习应用的开源性能库。提供了在配有英特尔处理器的电脑上安装库组件的具体步骤,要求处理器支持英特尔® 高级矢量扩展指令集 2(英特尔® AVX2)并运行 Ubuntu* 操作系统。第一部分还包括从命令行中创建 C 和 C++...

View Article

Image may be NSFW.
Clik here to view.

如何在英特尔® 至强融核™ 处理器中使用 MPI-3 共享内存

本白皮书简要介绍了 MPI-3 共享内存的特性、相应的 API 和一个示例程序,以展示如何在英特尔® 至强融核™ 处理器中使用 MPI-3 共享内存。MPI-3 共享内存简介MPI-3 共享内存是消息传递接口 (MPI) 标准版 3.0 的一个特性,实施于英特尔® MPI 库 5.0.2 版及更高版本。MPI-3 共享内存支持多个 MPI 进程,以分配并访问计算节点内的共享内存。对于需要多个 MPI...

View Article


Image may be NSFW.
Clik here to view.

使用英特尔® SPMD 程序编译器实现游戏 CPU 的矢量化

下载 GitHub* 代码示例简介基于 LLVM*的英特尔® SPMD 程序编译器 (在之前的文档中通常被称作 ISPC)并不是 Gnu* 编译器套装 (GCC) 或 Microsoft* C++ 编译器的替代品;它更类似于面向 CPU 的着色器编译器,可生成适用多种指令集的矢量指令,如英特尔® SIMD 流指令扩展 2(英特尔® SSE2)、英特尔® SIMD 流指令扩展 4(英特尔®...

View Article

Browsing all 49 articles
Browse latest View live