ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터분석 언어 R과 파이썬 비교, 장단점
    생활정보 2022. 10. 24. 12:25

    왜 데이터 분석이 뜨고 있을까?

      몇 년 전부터 데이터 분석의 중요성이 사회 전체적으로 강조되고 있는 상황입니다. 데이터 사이언티스트라는 직업의 몸값이 하늘 높은 줄 모르고 치솟고 있다는 기사를 1년 전에 본 것 같습니다. 우리의 생활이 전산화, 정보화되면서 하루에 생산되는 데이터의 양이 천문학적으로 늘고 있습니다. 그리고 그러한 많은 데이터를 처리할 수 있는 컴퓨터의 성능도 매일 발전하고 있습니다. 이러한 양상 때문에 데이터 분석이라는 분야가 뜨고 있다고 할 수 있습니다.

      이렇게 데이터분석의 분야가 중요해지고 있어서 아직 어린 분들은 이쪽으로 진로를 정할 수도 있을 것입니다. 대학원을 데이터사이언스 전공으로 진학해 데이터 분석 분야의 전문성을 쌓아나갈 수도 있겠습니다. 하지만 이미 전공을 끝내고 현업에서 일하고 있는 직장인 입장에서 데이터 분석을 배우는 것이 필요한지에 대한 의문이 있을 수 있습니다.

      저 역시 데이터분석을 따로 전공하지 않고 다른 분야에서 일을 하고 있습니다. 하지만 데이터 분석에 대한 기본적인 소양은 여전히 갖춰야 한다고 생각합니다. 데이터 분석이라는 것이 엄청난 양의 데이터를 분석해서 대단한 통찰을 도출하는 것이라고 생각할 수도 있습니다. 하지만 저는 업무에서 접하는 다양한 종류의 데이터 또한 분석의 대상이 될 수 있다고 봅니다.

     

    엑셀, 우리는 이미 데이터분석을 해봤다

      우리는 이미 직장에서 데이터분석으로 모두 해보았습니다. 바로 엑셀이라는 도구를 활용해서 말입니다. 엑셀은 적정한 양의 데이터를 다루는 데에 아주 훌륭한 프로그램입니다. 인터페이스도 직관적이고 배우기도 쉽습니다. 복잡한 함수나 VBA 코딩의 영역까지 배우기 시작하면 그 활용도는 매우 넓어집니다.

      하지만 저는 그럼에도 엑셀을 그렇게까지 배울 바에는 R이나 파이썬을 배우라고 하고 싶습니다. 엑셀의 단점은 먼저 속도가 느려서 데이터가 많아지면 쓰기가 불편해집니다. 다양한 데이터 분석 기능 또한 물론 구현할 수는 있겠지만 R이나 파이썬을 통해서 더 쉽게 가능해집니다.

     

    R에 대해서

      R과 파이썬은 정확히 말하면 프로그램이 아니라 프로그래밍 언어라는 점에서 엑셀과는 다릅니다. R은 1993년 뉴질랜드의 오클랜드 대학교에서 만들어진 통계 전용 프로그래밍 언어입니다. 태생부터가 데이터를 분석하기 위해 만들어졌다는 점에서 파이썬과는 다르다고 할 수 있습니다.

    R과 파이썬

      저는 대학교에서 경제학을 전공했습니다. 저는 학부생으로 학문의 길을 끝냈기 때문에 논문을 쓸 일이 거의 없었지만 수업 때 교수님을 통해 논문을 쓸 때 어떤 프로그램을 쓰는지 들었습니다. 보통 SPSS를 많이 쓴다고 하셨습니다. 제가 다니던 학과에서는 교육용 STATA를 구입해놓았었기 때문에 당시 수업 실습 때는 STATA를 사용했습니다. SPSS와 STATA는 모두 프로그래밍 언어라기보다는 통계 분석을 할 수 있는 프로그램이라고 보시면 될 것 같습니다.

     그때 교수님이 학생들에게 개인적인 연구를 하고 싶은데 프로그램들의 가격 때문에 부담스럽다면 R을 추천한다고 하셨습니다. R은 무료입니다. 무료라는 점 때문인지 세계적으로도 점점 많이 쓰여 그 생태계가 점점 커지고 있다고 합니다. 다양한 패키지가 만들어지고 질문을 주고 받는 커뮤니티도 활성화되고 있다고 합니다.

      R의 장점은 통계에 특화된 프로그램인 만큼 다양한 기능이 있다는 것입니다. 하지만 단점으로는 파이썬보다 속도가 느리다는 점이 있습니다. 또한 프로그래밍 자체를 위한 언어라기 보다는 통계를 위해 만들어진 언어이다보니 언어 자체가 체계적이지 못하고 배우기도 어려운 점이 있다는 점이 있습니다.

     

    파이썬에 대해서

      파이썬은 1991년 네덜란드 프로그래머가 만든 프로그래밍 언어입니다. R과는 다르게 데이터분석만을 위한 언어가 아닌 범용으로 여기저기에 쓰일 수 있는 프로그래밍 언어입니다. 파이썬의 가장 큰 특징은 배우기가 쉽다는 것입니다. 데이터 분석이 아니더라도 처음 프로그래밍을 배우는 사람들에게 많이 추천되는 언어가 파이썬입니다.

      아마도 데이터분석의 열풍과는 또 다르게 불고 있는 유행이 너도나도 코딩이라는 것을 배우자는 것입니다. 이때 파이썬이 프로그래밍 초보자들이 배우기 쉽다는 인식이 있어서 파이썬 입문 책도 베스트셀러가 되고 그랬던 것 같습니다. 이러한 관점에서 파이썬이 데이터 분석 툴로 함께 뜬 면도 없지 않아 있는 것 같습니다.

      파이썬의 장점은 R과 비교했을 때 처리속도가 빠르다는 것입니다. 이러한 장점의 연장선상으로 머신러닝, 딥러닝 등 연산 과정이 복잡한 AI 알고리즘을 실행하는데 R보다는 파이썬이 더 적합하다고 할 수 있습니다. 물론 R에서도 AI 알고리즘 기능이 제공되기는 하지만 그 수준이 파이썬을 따라가지 못한다고 합니다.

    댓글

Designed by Tistory.