20쪽- 하둡 허은정 |
|||||
---|---|---|---|---|---|
이름 | 헝느정ㄹ허은정 | 등록일 | 19.04.04 | 조회수 | 11 |
3. 윗글에서 나온 다음 도구나 언어들 중 하나를 선택하여 조사하고, 발표해 보자. - 주애
나. 하둡(Hadoop) - 허정
하둡은 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술이다. 수십만대의 컴퓨터에 자료 분산 저장 및 처리를 하는데, 하나 이상의 컴퓨터가 고장나는 경우에도 시스템이 정상동작한다. 하둡은 저렴하면서도 방대한 데이터를 분석할 수 있게 돕는다. 기업은 하둡을 활용해 빅데이터 분석에 들어가는 초기 비용을 줄이면서 자사 데이터 시스템과의 호환 문제도 손쉽게 해결할 수 있다. 2005년에 더그 커팅이 구글이 논문으로 발표한 GFS와 맵리듀스를 구현한 결과물로, 데이터의 복제본을 저장하기 때문에 데이터의 유실이나 장애가 발생했을 때도 데이터의 복구가 가능하다. 분산 파일 시스템인 HDFS에 데이터를 저장하고 분산처리 시스템인 맵리듀스를 이용하여 데이터를 처리한다. |
이전글 | 은정 짱 하은짱 재국짱 강우 짱짱 |
---|---|
다음글 | 16-17쪽 |