태그>cuda(총 42개의 글)
'cuda' 관련 최근글
-
- CUDA Programming on Fedora13

-
무에서 유를 창조하는 사람들 by 네라프|01/03 11:19
이제 CUDA compiler가 설치되었으니 잘 돌아가는지 확인을 해봐야겠지요. 여기로 가시면 예제로 배우는 CUDA Programming이라는 책의 예제 소스와 헤더파일들을 다운받을 수 있습니다. 받아서 압축을 푸시..
- CUDA Programming on Fedora13
-
- CUDA Programming on Fedora13

-
무에서 유를 창조하는 사람들 by 네라프|01/03 10:41
CUDA Programming을 하기에 앞서 필요한 것들 1. CUDA Programming을 지원하는 nvidia 사의 그래픽 카드(GPU) (자신의 그래픽카드가 지원하는지 여부를 확인하려면 클릭) 2. CUDA toolkit 3. CUDA..
- CUDA Programming on Fedora13
-
- CoreAVC 3.0.1 간단한 리뷰(?)~♤

-
돛대도 아니 달고~ 삿대도 없이~~~ by 루루카|2011/09/17 11:47
안녕하세요? CoreAVC 는 지난 9월 6일로 3 이 발표되었고, 9월 9일로 3.0.1 까지 나와있죠 CoreCODEC CoreAVC 3.0.1 여러가지가 추가되고 수정되었는데, 그 중 가장 눈에 띄는 내용이 9/10 bits 컬러 지원 추가와..
- CoreAVC 3.0.1 간단한 리뷰(?)~♤
-
- 8300GS 동영상 가속, CUDA

-
더럽고 치사하게~ by allrelease|2011/01/01 20:42
8300GS는 대기업 PC에만 납품된 모델로 단품을 밖에서 살 수 없음. MPEG2 제외하고 동영상 하드웨어 가속 안됨.CUDA 당연히 안됨.
- 8300GS 동영상 가속, CUDA
-
- GPU의 계산 정밀도에 대해

-
병렬 프로그래밍 by 지름시인|2010/12/15 21:04
NVIDIA의 GPU가 취급하는 부동소수점수 연산은 IEEE754에 따르고 있습니다. 연산이나 비정규화수 취급등의 차이에 의해, CPU와 연산결과가 다른 경우가 있습니다.적절한 부동소수점수의 계산오차에 대한 체크하지 않으면 버그인지 사양인지 알 수 없는 곤란한 문제에 직면합니다..
- GPU의 계산 정밀도에 대해
-
- CUDA Event로 시간측정

-
병렬 프로그래밍 by 지름시인|2010/12/14 17:49
이번은 호스트 프로그램으로 Kernel나 CUDA API의 실행 시간을 측정하는 방법에 대해 설명합니다. Kernel 내부에서의 시간측정에 관해서는 CUDA 프로그램의 시간을 측정하는 - clock()을 참고하세요. 시간측정의 주의점!CUDA API는 그 실행 문맥 중에서 제일 처음에 불린..
- CUDA Event로 시간측정
-
- CUDA 프로그램의 시간을 측정하는 - clock()

-
병렬 프로그래밍 by 지름시인|2010/12/14 17:34
CUDA에는 clock()라고 하는 편입 함수가 준비되어 있습니다.이것을 사용해 프로그램의 시간을 측정해 봅시다. clock() 함수 clock() 함수는 기기프로그램의 경과시간을 돌려주는 함수입니다.함수를 부르는 것만으로 간단하게 사용할 수 있어서 작은 처리 시간을 측정..
- CUDA 프로그램의 시간을 측정하는 - clock()
-
- WriteCombine 메모리액세스를 고속화한다

-
MMX,SSE를 이용한 C,C++ 병렬 프로그래밍 by 지름시인|2010/12/13 10:53
cudaHostAlloc로 할당한 WriteCombine 메모리에의 액세스는 보통 메모리에의 액세스와 비교하면 꽤 늦습니다. 조건에 따라 다르지만 수십배〜수백배의 속도 차이가 발생하기도 합니다. #include static inline unsigned int rdtsc() { unsigned int hi, lo; _asm_..
- WriteCombine 메모리액세스를 고속화한다
-
- Mapped Memory란?

-
MMX,SSE를 이용한 C,C++ 병렬 프로그래밍 by 지름시인|2010/12/13 10:23
Mapped Memory란? Mapped Memory는 CUDA 2.2부터 추가된 새로운 기능입니다. 지금까지 CUDA 프로그래밍 구조에서는 Host Memory(호스트머신 위의 메인 메모리)와 Device Memory(GPU상의..
- Mapped Memory란?
-
- NVIDIA Nexus(현재 Parallel Nsight)에 대해

-
MMX,SSE를 이용한 C,C++ 병렬 프로그래밍 by 지름시인|2010/12/13 09:33
NVIDIA Nexus는 CUDA C, OpenCL, DirectCompute의 대규모 병렬 응용프로그램개발을 위한 최초의 개발환경입니다. Nexus를 사용하면 Microsoft Windows에 있어서 통합적용 개발환경으로 가장 ..
- NVIDIA Nexus(현재 Parallel Nsight)에 대해
-
- GigaThread™스레드 스케쥴러

-
MMX,SSE를 이용한 C,C++ 병렬 프로그래밍 by 지름시인|2010/12/13 09:18
2개의 레벨에서 분산 형태로 실행되는 스레드 스케쥴러도 Fermi 설계에 탑재된 중요한 테크놀로지입니다. 칩 레벨에서는 글로벌한 처리 분배 엔진이 스레드 블록을 SM로 할당하고 SM레벨에서는 각각 구현된 워프..
- GigaThread™스레드 스케쥴러
-
- 메모리 서브 시스템의 이노베이션(innovation)

-
MMX,SSE를 이용한 C,C++ 병렬 프로그래밍 by 지름시인|2010/12/12 17:55
구성 가변인 L1 캐시와 통합 L2 캐시를 가지는 NVIDIA Parallel DataCache™계층 다양한 분야에서 수많은 종류의 GPU 계산·어플리케이션의 경험을 통해서 많은 과제에서 공유 메모리가 효과적이기는 하지만, 모든 과..
- 메모리 서브 시스템의 이노베이션(innovation)
-
- 제2세대 PTX (Parallel Thread Execution) ISA

-
MMX,SSE를 이용한 C,C++ 병렬 프로그래밍 by 지름시인|2010/12/10 23:40
Fermi 설계는 명령세트로 병렬 스레드를 실행하는 (PTX) 2.0을 처음으로 지원했습니다. PTX는 저수준 레벨의 가상 머신과 ISA(Instruction Set Architecture)로 구성되어 있어 병렬 스레드·프로세서의..
- 제2세대 PTX (Parallel Thread Execution) ISA
-
- 제3세대의 스트리밍·멀티 프로세서

-
MMX,SSE를 이용한 C,C++ 병렬 프로그래밍 by 지름시인|2010/12/10 23:01
제3세대의 스트리밍·멀티 프로세서 제3세대의 SM는 설계에 다양한 이노베이션(innovation)이 도입 되고 전에 없는 파워풀 성능과 동시에 프로그래밍 효율도 최고의 레벨이 되었습니다. 512개의 고성능 CUDA 코어 각 S..
- 제3세대의 스트리밍·멀티 프로세서


