开题报告
2017-03-18 09:54:10 0 举报
AI智能生成
1
作者其他创作
大纲/内容
课题背景和意义
GPS、北斗等导航系统
软件接收机
GPU/CUDA
国内外现状
当前接收机数据处理量不大
数据处理并行量不大
线程结构布局设计优化不够
内核函数性能优化不够
某些并行计算复杂度较高
论文目标
设计一个针对本项目的基于GPU的满足实时性要求的高并行框架
对于大量数据进行并行处理
优化复杂计算过程
任务
数据的矩阵乘积、求逆等运算
48路并发计算
技术方案
计算密集型流程的提取
线程结构布局优化设计
内核函数性能优化
合理利用CPU/GPU数据传输机制
高效的矩阵乘积、求逆算法
关键问题及解决思路
如何优化线程结构布局
分析项目本身的并行需求
利用NSight, Visual Profiler性能分析工具
内核函数性能优化
如何合理利用GPU内存、缓存机制
循环展开, 分支消除等
如何实现高效的矩阵乘积、求逆算法
0 条评论
下一页