태그>partitioning(총 5개의 글)
'partitioning' 관련 최근글
-
- Improving Spark Performance With Partitioning
-
Sensation by tobby48|2017/03/03 17:30
출처 : http://dev.sortable.com/spark-repartition/ At Sortable we use Spark for many of our data processing tasks. Spark is an engine that is scalable: it allows us to run many tasks in parallel across hundreds of machines in a cluster..
- Improving Spark Performance With Partitioning
-
- Improving Spark Performance With Partitioning
-
Sensation by tobby48|2017/01/06 14:46
ref. At Sortable we use Spark for many of our data processing tasks. Spark is an engine that is scalable: it allows us to run many tasks in parallel across hundreds of machines in a cluster, and can also be used to run tasks acro..
- Improving Spark Performance With Partitioning
-
- [Hadoop/Pig] pig의 join 종류
-
Sigel's house made of ice 。。。 by Sigel|2013/08/29 16:14
Apache Pig를 통해서 join하는 방법에는 몇 가지가 있다. 왜 그런고 하니, hadoop은 디스크를 많이 사용하는 대용량 작업이 많다. 특히 join과 같이 많은 데이터를 읽고 쓰는 경우라면 MR을 돌릴 때 데이터를 어떻게 옮기느냐에 따라서 수행시간에 많은 차이가 있을 수 있다. ..
- [Hadoop/Pig] pig의 join 종류
-
- Kernighan-Lin algorithm (KL-Mincut)
-
양리와 함께하는 행복한 세상 by 양리|2010/11/24 14:00
Kernighan-Lin algorithm (KL-Mincut):• greedy procedure• swaps two subsets of equal cardinality in each pass• each pass consists of |V|/2 steps
- Kernighan-Lin algorithm (KL-Mincut)
-
- SQLServer : 분할된 테이블 및 뷰
-
디밥의 블로그 by debop|2009/07/05 09:30
잘 사용하지 않는 SQL Server의 고급 기술인 테이블 분할과 관련된 글이 MSDN에 잘 설명되어 있습니다. (SQLServer 2005 기준) 한번 보시면, 뭐 적용범위는 작지만, 대용량 데이타를 다룰 때는 한번쯤 고려해야 할 사항입니다. 자료 : http://msdn.microsoft.com/ko-kr/li..
- SQLServer : 분할된 테이블 및 뷰