登录
首页 » 并行计算 » 利用CUDA平台计算矩阵乘法的GPU编程

利用CUDA平台计算矩阵乘法的GPU编程

于 2022-12-18 发布 文件大小:3.42 kB
0 347
下载积分: 2 下载次数: 1

代码说明:

本程序为简易的CUDA编程,两个程序都是计算矩阵的乘法。其中Matrix1和Matrix2的区别是Matrix2使用了shared memory。每个程序都使用了串行和并行两种方式计算乘法,最后将并行的运算结果与串行运算结果对比,验证计算的正确性。同时,程序中利用CUDA计时模块统计了并行运算的耗时。因此可以得出使用shared memory后改善的运行时间。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 应用于移动机器人路径规划的改进蚁群
    基于改进蚁群算法的移动机器人路径规划,解决机器人路径选择的低效率问题,本算法对传统蚁群算法进行了改进,包括解的构造过程,信息素更新过程,基本思想是,蚂蚁在经过的路径上留下信息素,信息素一方面随着时间的积累,较优路径上的信息素越积越多,一方面还要挥发。为什么要引入信息素呢?也是从传统的奖励机制发展过来的。
    2022-11-09 16:40:04下载
    积分:1
  • cuda
    资源描述VS_cuda并行计算 两基于vs实现的.cu代码 简单的实现矩阵相乘和反转。
    2022-05-21 15:38:13下载
    积分:1
  • HADOOP3使用开发教程
    hadoop是apache的开源项目,开发的主要目的是为了构建可靠,可拓展scalable,分布式的系统,hadoop是一系列的子工程的总和,其中包含。 1. hadoop common:为其他项目提供基础设施 2. HDFS:分布式的文件系统 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-09-26 15:25:03下载
    积分:1
  • 示波器代码
    示波器的源代码,效果不错的,dlo1w1dsc hhjhsdf sfdssd  fsdhsdfhsdj eewrew erewrewr dsfefh  dsdewh
    2022-07-07 20:07:57下载
    积分:1
  • spark apriori法实现代码
    应用背景  Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。  关键技术频繁项集挖掘采用spark实现的并行化挖掘算法。并行的apriori算法采用scala编写,并行的apriori采用java编写。里面会有较多函数使编程的内容。 
    2022-02-02 20:25:06下载
    积分:1
  • mpi4py 的逐次超松驰迭代的例子
    这是示例如何用逐次超松驰迭代 (SOR) 方法,求解线性系统的方程 使用 python 库 mpi4py。算法尝试计算节点之间平分。该程序不仅可以 在集群上运行。
    2022-04-29 12:44:20下载
    积分:1
  • PLINQ is Coming Up Soon (PFX)
    介绍
    2022-10-06 18:20:02下载
    积分:1
  • PI值的处理
    A console application that estimates the value of PI using a variety of both serial and parallel implementations, the latter done with both PLINQ and the Parallel class.
    2022-01-22 07:33:28下载
    积分:1
  • 冒泡排序的MPIC
    应用背景读取一个文本文件包含数字(小于2E8),它存储在一个动态数组的冒泡排序法,并打印出另一个文本文件。在终端中返回每个进程的运行时。如果该参数没有指定,默认为一个叫做“Sal txt文件。”(必须保存在当前目录),如果参数定义的文件进入参数与数组排序。关键技术泡沫排序,有时也称为“下沉排序”,是一个简单的排序算法,通过列表中的重复步骤来进行排序,比较每一对相邻的项目,如果它们是错误的顺序。通过列表的传递,直到不需要进行任何交换,这说明列表是排序的。这是一个比较排序的算法,它被命名为较小的元素“泡沫”到列表的顶部。虽然算法简单,但对于大多数问题来说,它是太慢和不切实际的,即使在插入排序。[ 1 ]它可以是实际的,如果输入通常是按排序顺序,但可能会偶尔有一些顺序元素的位置近。
    2023-01-14 11:15:03下载
    积分:1
  • 读取参数文件
    #include #define  NUMBER   4 void main( ) {    int i=1; float f0,dt,dx,dz; int mx,mz,ntmax,pml,sou_x,sou_z,rec_start,rec_end,rec_int,rec_depth; char shotID[5],record_pp[30],vp_name[30],rou_name[30],mig_name[30],mig_pyt_name[30],mig_udlf_name[40],shuoming[30]; FILE *fp,*f; /*&不合法变量*/     printf("** This program is to show the block file input & output** "); fp=fopen(
    2022-09-05 20:35:03下载
    积分:1
  • 696516资源总数
  • 106914会员总数
  • 0今日下载