본문 바로가기

Data analysis story

[Python]-파이썬 자료형, 딕셔너리(Dictionary)[딕셔너리 생성, 딕셔너리 쌍 추가, 삭제하기, 요소 접근, .keys(), .values(), .items(), .clear(), 자료형의 참과 거짓] 안녕하세요, 여러분!!! 오늘은 파이썬 자료형! 그 네 번째 시간으로 마지막 자료형인 딕셔너리에 대해 다루어 보도록 하겠습니다!!!! “이름”=”홍길동” “학번”=201623124 “주소”=”서울시” 파이썬은 이러한 대응 관계를 나타낼 수 있는 자료형을 가지고 있는데 이것이 바로 딕셔너리(Dictionary)입니다. 딕셔너리는 키(key)와 값(value)의 쌍을 저장할 수 있는 객체로서 위의 예시에서는 “이름”, “학번”, “주소”가 key이고 “홍길동”, 201623124, “서울시”가 value입니다. 다른 예시를 들어보면 이것이 키(key)와 값(value)의 구조입니다. 딕셔너리 생성 그렇다면 이러한 대응구조를 어떻게 생성할 수 있는 것일까요?? 전체적인 구조는 이렇습니다!! 세트 자료형에서 썼.. 더보기
[Python]-파이썬 자료형, 튜플 자료형, 세트 자료형(집합 자료형)[시퀀스 자료형의 의미, 튜플의 생성, 예시, 튜플의 생성, 삭제, 변경, 튜플의 인덱싱과 슬라이싱, 더하기, 곱하기, tuple(), 세트의 .. 안녕하세요, 여러분! 오늘은 파이썬의 자료형, 그 세 번째 시간으로!! 튜플에 대해 배워보려고 합니다! 저번 시간까지 해서 숫자, 문자열, 리스트 자료형까지 다뤄보았습니다! 그리고 마지막에 시퀀스 자료형에 대해서도 언급했었죠! 시퀀스 자료형은 순서를 가진 요소들의 집합이라고 했었습니다. 저번 시간까지 배운 문자열과 리스트는 시퀀스 자료형이었고 그리고 오늘 배울 튜플도 시퀀스 자료형이기 때문에 공통적으로 시퀀스 자료형에서 가능한 연산과 함수들 (저번 포스팅에 올려 놓은 표!) 오늘 배울 튜플에도 적용됩니다!! 그렇다면 튜플이 이 시퀀스 자료형이라는 것을 알았으니! 이제 본격적으로 튜플 자료형이 무엇인지 알아보도록 하죠!! 튜플 튜플은 한마디로 정의하자면 변경될 수 없는 리스트입니다. 즉, 리스트는 그 값의.. 더보기
[Python] 파이썬 자료형, 리스트(리스트 관련 함수들[append(), extend(), index(), sort(), sorted, insert(), pop(), remove(), reverse()], 리스트 함축, 리스트 함축의 조건식, 시퀀스 자료형 공통 함수) 안녕하세요! 여러분!!! 오늘은 파이썬 자료형 두번째 "리스트"의 두번째 포스팅으로!! 저번 포스팅에서 못다한 것들을 다루도록 할거에요!! 리스트 관련 함수들 리스트와 함께 쓰는 유용한!! 여러 가지 함수들이 있는데요!! 문자열과 마찬가지로 리스트 변수명 뒤에 ‘.’를 붙여서 여러 가지 리스트 관련 함수들을 이용할 수 있습니다! ① append() 먼저 리스트의 요소를 추가하는 함수부터 보겠습니다. append는 ‘덧붙이다’라는 의미를 가진 단어인데요 append()를 통하여 리스트에 요소를 추가할 수 있습니다. 이렇게요! 그림으로 이해해 볼게요! append 함수로 리스트에 리스트를 추가할 수도 있습니다. 이렇게 말이죠! 그런데 만약 한 번에 여러 개의 원소를 추가하려고 한다면? 어떻게 될까요?? 이렇.. 더보기
[Python]- 파이썬 자료형, 리스트(리스트 생성, list()함수, 혼합 자료형 리스트, 내장 리스트, 리스트의 인덱싱과 슬라이싱, 내장 리스트 인덱싱과 슬라이싱, 리스트의 연산[더하기, 곱하기], 리스.. 안녕하세요! 여러분!! 오늘은 “파이썬의 자료형”, 그 두번째 시간으로!! “리스트”에 대해서 배워보도록 합시다!! 저번 시간까지 파이썬의 자료형 중 숫자와 문자열에 대해서 알아보았는데요! 숫자와 문자열만 가지고 프로그래밍을 하기에는 부족한 점이 많습니다!! 왜나고요?? 예를 들어 1부터 100까지 숫자 중 짝수인 수를 모아서 하나의 변수에 할당하려고 한다고 해봅시다! 이런 숫자 모음을 숫자나 문자열로 표현하기에는 무리가 있네요. 하지만 “파이썬은 여러 개의 값을 모아서 하나의 변수에 저장할 수 있도록 해주는 자료형”을 제공합니다. 이를 바로 “리스트(List)”라고 하는 것이죠! 리스트는 여러 값에 대해 하나의 이름을 공유하기 때문에 값들을 조작이 편리하므로 꼭 필요한 자료형이라고 할 수 있습니다. 리.. 더보기
[Python]-파이썬 자료형1. 문자열의 모든 것(문자열 만들기, 이스케이프 코드, 문자열 연산, 문자열 인덱싱, 슬라이싱, 문자열 포매팅) 안녕하세요! 여러분!! 저번 시간까지 파이썬의 함수!에 대해 낱낱이 파헤쳐보았는데요!^^ 이번 시간부터는 "파이썬의 자료형"에 대해서 살펴보도록 할꺼에요! 자료형은 무엇을 의미하는 것일까요? 자료형이란 Data Type이라고도 하며 변수나 상수가 저장할 수 있는 자료의 형식을 의미합니다. 즉, 프로그래밍을 할 때 쓰이는 숫자, 문자열 등 자료 형태로 사용되는 모든 것을 말하죠! 따라서 프로그램의 기본이자 핵심 단위!라고 할 수 있죠! 우리는 이제껏 숫자, 문자열 형태의 자료형만 봐왔었는데요. 파이썬의 자료형에는 더 많은 것들이 존재합니다! "숫자형, 문자열 자료형, 리스트 자료형, 튜플 자료형, 딕셔너리 자료형, 집합 자료형!" 에 대해서 이번 시간부터 차근차근 배워보도록 합시다! 숫자형은 이미 포스팅한.. 더보기
[R 프로그래밍-aggregate 함수, grep 함수, gsub 함수, cut 함수] 안녕하세요! 여러분!! 오늘은 저번 두개의 포스팅에 걸쳐 다뤘던! apply 계열 함수에 이어 데이터분석을 위한 R의 내장 함수 중 중요한 aggregate 함수에 대해서 알아보겠습니다!! apply 함수를 꼭 숙지하시고 오세요! 먼저 aggregating을 왜 하는지에 대해서 알아봅시다! 먼저 aggregating을 설명하기 위해 사용할 데이터를 소개할게요! 이 데이터들을 보면 나이, 성별, 수입, 자녀 수, 자가 여부, 구독 여부, Segment 등등에 대한 데이터가 나와있는데요! 이 데이터는 한 회사의 케이블 TV에 관한 데이터라고 합니다! 그러면 이 케이블 TV 데이터를 통해서 이 회사가 얻고 싶은 정보가 무엇일까요? 어떤 사람들이 우리의 케이블 TV를 구독하는지 궁금하지 않을까요? 예를 들어서 .. 더보기
[R프로그래밍-apply 계열 함수(sapply함수, mapply함수, tapply함수 쉽게 이해하기+unlist 함수) 안녕하세요 여러분! 오늘은 apply 계열 함수 그 두번째 시간!!! 으로! 저번에 배우지 못했던 sapply, mapply, tapply 함수에 대해서 마저 다루어 보려고 합니다! 저번 포스팅의 apply 함수에 대한 이해가 꼭 전제되어야 하므로 전 포스팅을 꼭 완벽 숙지한 후 읽어주세요~! 저번 포스팅에서는 apply 함수와 lapply 함수에 대해서 자세히 살펴봤습니다! 이번 포스팅에서는 먼저 sapply에 대해서 배워볼게요! ③ sapply 저번 시간에 마지막으로 배운 lapply는 값을 리스트로 돌려주기 때문에 바로 가져다 쓰기에 조금 불편했습니다. 변수로 지정 후 $ 연산을 활용해서 하나씩 불러와야만 했죠! 가능한 경우에 한에서 (결과들이 모두 같은 자료 형일 때만 가능해요!) 그 결과를 단순.. 더보기
[R프로그래밍-apply 계열 함수(implicit loop과 explicit loop의 차이, apply함수, lapply함수)] 쉽게 이해하기 여러분~! 안녕하세요! 오늘은 apply 계열 함수들에 대해 배워보도록 하겠습니다!! 다들 ‘apply’라는 영단어의 뜻을 알고 계신가요? 바로 ‘적용하다’라는 의미를 가지고 있죠! apply 계열 함수도 단어 뜻 그대로 ‘적용하는’ 함수라고 이해하면 쉽습니다! 그렇다면 ‘무엇’에다가 ‘무엇’을 적용하는 것일까요? 결론부터 말하자면 바로 ‘데이터’에다가 ‘함수’를 적용합니다. ‘데이터’에다가 ‘함수’를 적용한다구요? 우리는 이때까지 데이터에 r 내장함수, 심지어는 사용자 지정 함수까지 적용해왔었는데요! 뭐가 다른걸까요? 바로 apply 계열 함수는 일련의 데이터에다 원하는 함수를 ‘반복적으로!!!’ 적용시켜준다는 점이죠! 이제껏 데이터에 함수를 적용했었지만 데이터 하나마다 각각 함수를 적용했었잖아요! ".. 더보기