본문 바로가기

PYTHON30

20200410 - R 파이썬 함수, 클래스, 파일다루기, 실전 프로젝트, 파이썬과 COM 1. 함수 def print_ntimes(): print("대신증권") 대표사진 삭제 함수가 실행되고 호출되는 과정 대표사진 삭제 사진 설명을 입력하세요. ★ 파이썬의 함수는 튜플로 묶었을 경우에 두 가지를 한번에 리턴할 수 있다. >>> def cal_upper_lower(price): offset = price * 0.3 upper = price + offset lower = price - offset return (upper, lower) >>> ★ 호출했을 경우 저장받는 변수도 두 개를 적어줘야 한다. (반환하는 것도, 받아주는 것도 튜플로 묶어야 리턴하고 받아줄 수 있다.) >>> (upper, lower) = cal_upper_lower(10000) >>> upper 13000.0 >>> lo.. 2020. 4. 10.
20200409 - Python 파이썬 소개, 기본문법, 연습문제, 예제파일, (시험) Chapter 1. 파이썬 소개 프로그래밍이란? 프로그램 : 컴퓨터에게 작업을 어떻게 시킬 지를 기록해놓은 작업 지시서. 파워포인트, 카카오톡과 같은 앱들이 모두 프로그램. 프로그램 내부 : '무엇을 어떻게 해라' 와 같은 형태의 명령어(instruction)들이 들어 있다. #################파이썬 설치 파이썬 3.8.2(64bit) 1. 관리자권한으로 실행 2. Add python 3.8 to Path 체크하기 대표사진 삭제 사진 설명을 입력하세요. 3. Install Now 4. 설치완료 http://www.python.org: 파이썬 다운 주소 The Python Tutorial — Python 3.8.2 documentation The Python Tutorial Python is .. 2020. 4. 9.
20200408 - R 대시보드(flexdashboard, shiny 패키지, 보고서 다루기) R 대시보드 - flexdashboard 를 이용하면 R로 유연하고 (flexible), 매력적이며(attractive), 쌍방향의(Interactive) 대시보드를 쉽게(easily) 만들 수 있음. - 대시보드 작성 및 커스터마이제이션은 Rmarkdown에 기반하여 이루어지며, Shiny 컴포넌트들도 덧붙일 수 도 있다. - 이외에도 htmlwidgets, base/lattice/grid 그래픽, tabula(표) 데이터, 주석 같은 다양한 컴포넌트들까지도 지원하며, 열과 행 기반 레이아웃, 스토리보드 등이 제공된다는 장점도 가지고 있음 2. flexdashboard 시작하기 flexdashboard 는 R의 패키지이므로, 설치는 R의 여타 패키지처럼 설치 - 쉼표로 여러개 한번에 설치 가능 대표사진.. 2020. 4. 8.
20200406 - R 파싱하여 데이터 가져오기, 웹 페이지 크롤링, 트리맵, 워드클라우드, 차트 R 파싱하여 데이터 가져오기 ########################################## # 웹에서 문자열 가져오기 ########################################## # revest 패키지의 read_html("url"); # html 파싱 # 특정 노드의 데이터 가져오기 # 문자열에서 html_nodes(태그 또는 클래스 또는 아이디)를 이용하면 매개변수에 해당하는 모든 데이터를 가져온다. # 마지막 데이터까지 가져온 경우 html_text() 메소드나 html_attr(속성명)을 이용해서 # 문자열로 가져오는 것이 가능. ########################################## # 네이버(http://www.naver.com) ######.. 2020. 4. 6.
20200403 - R, 텍스트 마이닝(형태소 분석, 품사 추출, 빈도표 만들기, 시각화) 1. 텍스트 마이닝(Text mining) - 문자로 된 데이터에서 가치있는 정보를 얻어 내는 분석 기법 - SNS나 웹 사이트에 올라온 글을 분석해 사람들이 어떤 이야기를 나누고 있는지 파악할 때 활용 - 형태소 분석(Morphology Analysis) : 문장을 구성하는 어절들이 어떤 품사로 되어 있는지 분석 - 분석 절차 1) 형태소 분석 2) 명사, 동사 형용사 등 의미를 지닌 품사 단어 추출 3) 빈도표 만들기 4) 시각화 10-1. 힙합 가사 텍스트 마이닝 텍스트 마이닝 준비하기 Java 다운로드 및 설치 #패키지 설치 install.packages("rJava") install.packages("memoise") install.packages("KoNLP") #########라이브러리 로드.. 2020. 4. 3.
20200402 - R (데이터 전처리, 변수 간 관계 분석 - 직업별 월급 차이 ) 09-6. 직업별 월급 차이 - " 어떤 직업이 월급을 가장 많이 받을까 ?" 분석 절차 1. 변수 검토 및 전처리 - 직업 - 월급 2. 변수 간 관계 분석 class(welfare$code_job) # numeric 확인 table(welfare$code_job) # 각 빈도수 확인 2. 전처리 --> 직업 분류코드 목록 불러오기 library(readxl) list_job % select(code_job, job) %>% head(10) 대표사진 삭제 사진 설명을 입력하세요. 직업별 월급 차이 분석하기 1. 직업별 월급 평균표 만들기 job_income % filter(!is.na(job) & !is.na(income)) %>% group_by(job) %>% summarise(mean_income.. 2020. 4. 2.
20200401 - R 차트 그리기, 상관관계 분석, 삶의 질 평가 실습 R 로 데이터 분석을 할 때(분석에 대한 가설을 만들어 놔야 한다. – 약 5개 정도) 1. 데이터 수집(가설에 합당한 데이터) 2. 데이터를 수집했으면 데이터를 읽어 들여야 한다. (읽기 전에 전처리가 가능하면 전처리 먼저 수행) 3. 데이터 내부 구조 분석(head, tail, summary 등으로 파악) 4. 칼럼에 대한 설명이 별도 파일로 모두 나와있다. (이 내용을 파악) 5. 4번 정보를 토대로 NA값/이상치가 있는지 없는지 검증해야 한다. (이 때도 마찬가지로 결측값과 이상값을 처리(전처리 작업)) – 정제작업 6. 어떤 통계 기법을 이용해서 분석했다. 내용이 보고 서 내부에 포함되어야 한다. 7. 시각화 작업 3. 데이터 분석을 위한 연장 챙기기 변수(Variable) • 다양한 값을 지니.. 2020. 4. 1.
20200331 - R - 워드 클라우드(word cloud), 연설문 읽기, 인구이동 대표사진 삭제 7번 작업까지만 한 것 (1) 대통령별 목록 보기 -대통령 기록관(http://pa.go.kr/index.jsp) -기록물정보/검색 → 대통령별 콘텐츠’에서 ‘김영삼대통령’ 클릭 (2) 대통령별 콘텐츠 보기 -콘텐츠 구성 항목에서 대통령의 ‘연설기록’ 선택 (3) 대통령 연설문 목록 보기 -연설기록 목록에서 ‘제14대 대통령 취임사’ 선택 (4) 대통령 취임사 내용 보기 및 파일 저장 -취임사 내용 전체를 마우스로 선택하여 복사한 후 speech.txt로 저장 대표사진 삭제 사진 설명을 입력하세요. 대표사진 삭제 사진 설명을 입력하세요. 대표사진 삭제 사진 설명을 입력하세요. 전송중... 사진 설명을 입력하세요. 전송중... 사진 설명을 입력하세요. as.Date("2020년 11월 1일".. 2020. 3. 31.
20200330 - R 기초 문법 (연산자, 차트, 패키지, 데이터 기초) #빅데이터 1. 데이터 1) 정성적 데이터 : 언어, 문자 등으로 이루어짐 – 오늘 날씨가 좋다 2) 정량적 데이터 : 수치, 도형, 기호 등으로 이루어짐 – 나이, 몸무게 3) 목적론적 특성 : 우리의 인식체계에서 어떤 사실에 대해 “데이터”라고 인식하게 되는 객체가 가지고 있는 존재 목적. 수요조사, 실험 검사 측정 등을 통해 데이터를 수집 축적 다양한 방법으로 분석 하여 논문 예측 경영전략 정책을 수립하는 일련의 가치 창출. - 총선에 관련된 것 또한 수요조사 중 하나(코로나로 인한 마스크 구매 - 중국에서 원료 조달 불가로 인해 생산 차질 발생) 4) NoSQL : Not-Only-SQL 빅데이터 분산처리 및 저장 기술과 함께 발달된 분산 데이터베이스 기술(정형화 되지 않은 SQL) - 구조적인 .. 2020. 3. 30.
728x90
반응형