본문 바로가기

Data analysis story

[R 프로그래밍]- Matrix(행렬) 안녕하세요 여러분! 저번 포스팅에서는 R의 데이터 타입 그 두 번째 시간으로 Factor에 대해서 배워보았습니다! "이번 포스팅에서는 Matrix에 대해 차근차근 공부해보도록 해요!" 먼저 ‘행렬’에 대해서는 고등학교 수학에서 배웠었죠? 행렬은 행과 열로 정돈된 실수들의 사각형 배열이라고 할 수 있습니다! 그림을 보니 다들 기억이 나시죠?? 행렬은 우리가 앞서 배운 Vector와 마찬가지로 같은 자료형만 저장 가능합니다. 즉, 벡터와 마찬가지로 문자나 숫자를 동시에 저장할 수 없다는 것이죠! 그렇다면 Vector와 다른 점은 무엇일까요? Vector는 1차원! 바로 우리가 오늘 보고자 하는 행렬은 2차원의 구조입니다. 그러면 이제 행렬을 생성하는 법을 배워봅시다! 행렬을 생성할 때는 vector(vect.. 더보기
[R프로그래밍] Factor(팩터) 안녕하세요 여러분! 저번 시간에 R의 데이터 타입 중 벡터에 대해서 배워보았습니다! 이번 시간에는 Factor에 대해 알아보도록 하겠습니다! Factor에 대해 알아보기 전에 먼저 통계에 관한 기초 지식부터 잡고 갈게요! 통계에서 자료는 일반적으로 수치형 자료(numerical data)와 범주형 자료(categorical data), 이 두 가지로 구분됩니다. 먼저 수치형 자료란 관측된 값이 수치로 측정되는 자료를 말합니다. 예를 들면 키나 몸무게, 성적과 같은 자료들이 모두 수치형 자료입니다. 이에 비해 범주형 자료는 관측 결과가 몇 개의 범주 또는 항목의 형태로 나타나는 자료를 말합니다. 성별은 ‘남’과 ‘여’로 범주화 되어 있고 혈액형은 ‘A’,’B’,’AB’,’O’로 범주화 되어 있잖아요! 이런.. 더보기
[Python] 반복문 for문(range 함수, 응용한 여러 프로그램 예시) 안녕하세요 여러분! 저번 시간에 if 조건문에 대해서 공부해봤습니다! if 조건문을 설명하기 앞서 파이썬의 기본적인 구조 3가지에 대해 소개해드렸었는데요! 다시 한번 볼까요? 선택 구조는 if 조건문에서 사용됨을 확인했었습니다. 오늘은 반복 구조에 대해서 살펴볼텐데요! 반복 구조는 for문과 while문에서 사용되는데요 for문은 정해진 횟수만큼 반복하는 구조이고 while문은 어떤 조건이 만족되는 동안, 계속 반복하는 구조입니다. 이번 포스팅에선 for문에 대해 자세히 공부하도록 하겠습니다. for문을 자세히 알아보기에 앞서 반복문은 왜 필요할까요? 컴퓨터는 인간과 다르게 반복적인 작업을 실수 없이 빠르게 할 수 있습니다. 이것이 컴퓨터의 가장 큰 장점이라고도 할 수 있죠! 동일한 작업을 오류 없이 반.. 더보기
[Python] if 조건문 (if-else, elif, if문을 활용한 다양한 프로그램 예시) 안녕하세요 여러분! 이번 시간부터는 파이썬의 제어문에 대해 살펴보려고 합니다! if문과 for문, while문에 대해서 순차적으로 포스팅해보겠습니다! 이번 포스팅에서는 파이썬의 if문에 대해서 배워볼건데요! if문을 시작하기에 앞서 파이썬의 3가지 기본 제어 구조에 대해서 말해보려고 합니다. 파이썬에서는 기본적으로 제어 구조만 이해해도 코딩을 해석할 수 있는 범위가 넓어지기 때문이죠! 그림을 보면서 이해해봅시다! 도로로 표현된 그림을 보니 이해가 쏙 되죠?? 선택구조는 if문, 반복구조는 while, for문으로 구현되니까 이 구조들에 대한 개념을 확실히 하고 갑시다! 그럼 제어문 첫 시간으로서 본격적으로 if문에 대해서 알아볼게요! 앞서 말했듯이 이번에 다룰 if문은 선택 구조인데요, 그러면 선택 구조.. 더보기
[Python] 파이썬의 연산자, 산술 연산자, 연산자 우선순위, 복합 연산자 안녕하세요 여러분! 앞선 2개의 포스팅에서 변수, 함수(내장함수)에 대해서 공부해봤는데요! 오늘은 수식과 연산자에 대해서 다뤄보려고 합니다. 저번 포스팅을 진행하면서 수식과 연산자가 나왔는데요! 추가 설명을 하지 않아도 직관적으로 이해할 수 있을 만큼의 수식이라 그냥 넘어갔었습니다! 이 포스팅에서는 조금 더 자세하게 배워보죠! 일단 수식(expression)이 뭘까요? 수식이란 피연산자들과 연산자의 조합입니다. 더 어렵나요? 연산자(operator)는 연산을 나타내는 기호이며, 피연산자(operand)는 연산의 대상이 되는 것입니다. 그림을 통해 이해해 봅시다! 이제 이해가 되나요?? 다른 건 다 이해가 되는데 ‘*’ 기호는 과연 무엇을 나타내는 걸까요? 여기서 연산자 *는 곱하기를 나타내는 연산자입니다.. 더보기
[Python] 내장함수-print, input, int, float, str, abs, round, pow 함수 안녕하세요 여러분! 오늘은 파이썬 포스팅 그 두번째! 자주 쓰는 몇 가지 내장 함수에 대해 다루어 보도록 하겠습니다! (앞 포스팅에 파이썬의 변수 의미, 변수 생성, 변수 이름, 변수 값 교환 등등 변수에 대해 자세히 다뤘으니 참고하세요!) 오늘은 함수에 대해 배워볼 건데요! 함수란 무엇일까요? 프로그래밍에서 함수를 설명하기 위해서는 많은 책에서 ‘믹서기’를 호출하는데요! 믹서기를 생각해봅시다. 믹서기에 과일을 넣으면? 믹서기가 과일을 갈아 주스를 만들죠! 이렇게 믹서기에 넣는 과일은 “입력”이고 나오는 과일주스는 “출력”이 됩니다. 그렇다면 믹서기는 무엇일까요? 믹서기는 과일을 입력 받아 주스를 출력하는 “함수”와 같습니다. 우리가 배우려는 “함수”는 믹서기의 역할을 하는 것이라고 생각하면 되는데요! .. 더보기
[Python] 파이썬의 변수, 상수 안녕하세요 여러분! 추후에 하게 될 데이터 분석을 위해 이번 포스팅부터 파이썬의 기초를 차근차근 쌓는 시간을 가져 볼게요! 지금 R과 함께 포스팅을 하고 있는데 3개월 간 데이터 분석의 도구가 되는 R과 파이썬을 우리 함께 열심히 공부해봅시다! 파이썬에 대해 배워보기에 앞서 도대체 R프로그래밍, 파이썬 프로그래밍이라는 말의 “프로그래밍”의 뜻은 무엇일까요? 그 의미부터 정확히 알고 배웁시다! 우리가 컴퓨터에게 일을 시키려면 자세한 명령어(instruction) 리스트를 부여해야 하는데, ‘수행할 명령어를 적어 놓은 문서’를 프로그램이라고 합니다. 그래서 복잡한 프로그램은 많은 문서가 쌓여 있는 하나의 book이라고 할 수 있죠. 그러면 프로그램은 도대체 어떻게 만들어지는 걸까요? 인간은 컴퓨터가 이해할 .. 더보기
[R프로그래밍]- 데이터 타입① 벡터(Vector) 안녕하세요! 저번 포스팅에서 R의 기본 자료형에 대해서 알아보았습니다! numeric, character, logical, complex, raw 등등을 같이 공부해봤습니다! 그러면 이번 포스팅부터 본격적으로 데이터 타입에 대해서 배워볼텐데 정말 아무리 강조해도 지나치지 않을 중요한 시간이라고 할 수 있겠네요! 먼저 R에서 제공하는 여러 데이터 타입에 대해 표 형식으로 preview 해볼까요? R의 기본 데이터타입은 vector를 포함하여 다음과 같은 다양한 데이터 타입을 제공하고 있습니다. R에서 제공하는 데이터 타입이라는 것은 실제 세계의 자료를 표현하는 방법입니다. 즉, 실제 세계의 자료를 표현할 수 있게끔 R에서 어떤 형태들을 지원해주냐는 것이죠. 예를 들어 여러 개의 숫자를 이용해서 평균을 구한.. 더보기