728x90
반응형

전체 글 68

파이썬으로 영단어 공부하기

파이썬 연습차 영단어를 공부할 수 있는 단어장을 만들어 보았습니다. 이번에는 데이터프레임과 PyQT를 사용해보는데 의의를 두었습니다. import sys from PyQt5.QtWidgets import * from PyQt5 import uic from PyQt5.QtCore import Qt from mygraphwidget import * import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib.backends.backend_qt5agg import FigureCanvasQTAgg as FigureCanvas from matplotlib.figure import Figure form_class = ui..

파이썬으로 간단한 자판기 만들기

파이썬에 익숙해지기 위해 연습차 클래스로 자판기를 만들어보았습니다. R은 통계를 위한 언어인 반면 파이썬은 다양한 목적을 위해 사용될 수 있어서 프로그래밍 관련된 기본 지식이 조금 더 필요한 것 같은 인상을 받았습니다. class bev: def __init__(self, name, price, stock): self.name = name self.price = price self.stock = stock def __str__(self): return self.name + ' - ' + str(self.price) + 'won - ' + str(self.stock) + 'ea' def __repr__(self): return str(self) # 관리자 기능 클래스 # 관리자용 기능을 사용하기 위해서는 ..

제4회 빅데이터 분석기사 필기 합격 후기(비전공자)

2022년 4월 9일 진행된 제4회 빅데이터 분석기사 필기시험을 보고 왔습니다. 아직 회차가 많지 않은 시험이라 혹시 공부에 도움이 되실까 해서 후기 남깁니다. *4월 22일 조기발표된 결과 합격으로 확인했습니다! 1. 사전 지식 비전공자로 따로 배운 내용은 없고 이전 자잘한 자격증을 따면서 조금씩 관련 내용을 들어본 적은 있는 상황이었습니다. 직접적으로 관련 있는 자격증은 3~4년 전에 땄던 ADsP, 사회조사분석사 2급 정도인 것 같고 약간 거리가 있지만 작년에 취득했던 경영지도사 마케팅 자격증에서도 통계 관련된 내용이 있었습니다. 2. 공부 방법 및 기간 웬만한 자격증 시험은 문제집을 잘 고르면 60점 받기는 어렵지 않기 때문에 교재를 먼저 찾아봤습니다. 빅데이터 분야의 인지도가 높아진 것도 꽤 시..

앤디 필드의 유쾌한 R 통계학 챕터 6 - 상관분석

상관분석을 진행하고자 할 때 언제 어떤 방법을 사용할지 잘 판단해야 한다. 정규분포하는 연속형 변수 사이의 관계를 볼 때는 가장 일반적인 피어슨 상관계수를 사용한다. 정규분포가 아닌 변수 사이의 상관관계를 파악할 때는 스피어만 상관계수를 사용한다. 다만 중복값(동순위값)이 많은 경우에는 켄달의 타우를 사용한다. 연속변수와 이분변수 사이의 관계를 파악할 때 이연 상관계수를 사용하는데 이분변수의 원천이 연속형인 경우에는 이연, 아닌 경우에는 점이연이라고 하며 이연변수 확인을 위해서는 cor, cor.test 함수가 아닌 polyserial 함수를 사용한다. (점이연은 그냥 cor함수를 사용한다.) 여러 변수들 중 내가 원하는 두 변수 사이의 관계만 확인하고 싶은 경우 편상관 분석을 시행한다. 이때 pcor ..

데이터 분석/R 2022.04.08

앤디 필드의 유쾌한 R 통계학 챕터 5 - 자료 가정

챕터 5에서는 R을 활용하여 표본 자료의 정규성, 등분산성을 검증한다. 정규성 검정은 stat.desc() 함수와 shapiroTest() 함수를 활용하고 등분산 검정은 leveneTest() 함수를 활용한다. 이 때 단순히 함수만 사용하는 것이 아니라 히스토그램, Q-Q plot, 분산비 등을 통해 다시 한 번 자료를 살피는 것도 필요하다. rm(list=ls()) # 이번 챕터에서는 R을 통해 분포의 정규성과 분산의 동질성(homogeneity)을 확인하는 방법을 배운다. library(car);library(ggplot2);library(pastecs);library(psych);library(Rcmdr) # 눈으로 정규성 확인하기 # 데이터 불러오기 dlf

데이터 분석/R 2022.04.05

앤디 필드의 유쾌한 R 통계학 챕터 4 - 기초 시각화

챕터 4에서는 ggplot2를 사용하여 여러 가지 그래프를 그리는 방법을 배운다. rm(list=ls()) # 이번 챕터에서는 ggplot2를 사용한다. library(ggplot2) # 그래프는 기하 객체(geom), 미적 속성(aes)로 구성된다. # 자주 쓰이는 geom geom_bar() # 선 그리기 geom_point() # 점 그리기 geom_line() # 자료를 잇는 직선 그리기 geom_smooth() # 자료 전체를 요약하는 직선 그리기 gem_histogram() # 히스토그램 그리기 geom_boxplot() # 박스플롯 그리기 geom_text() # 텍스트 넣기 geom_density() # 밀도 그래드 그리기 geom_errorbar() # 오차 막대 그리기 geom_vlin..

데이터 분석/R 2022.04.01

앤디 필드의 유쾌한 R 통계학 챕터 1, 챕터 2 - 통계 용어와 개념

챕터 1과 챕터 2에서는 기본적인 통계 용어와 개념을 설명한다. 모든 내용이 중요하지만 대부분은 익숙한 용어라 부분부분 간단한 설명만 덧붙인다. 챕터 1 데이터 분석의 진행 순서 + 관련 용어 답이 필요한 질문을 찾는다 검증할 가설을 만든다 가설은 과학적으로 검증할 수 있어야 한다 측정할 변수를 정한다 변수의 분류 독립변수와 종속변수 범주형 변수 : 이분, 명목, 순서 연속변수 : 구간, 비율 변수 측정시 고려할 점 타당성 : 측정하고자 하는 것을 측정하는가? 기준 타당성 내용 타당성 : 측정이 대상을 얼마나 대표할 수 있는가? 신뢰도: 측정에 일관성이 있는가? 측정 방법을 정한다 상관연구와 실험연구 그룹간 설계 = 개체간 설계 = 독립설계 개체내 설계 = 반복측정 설계 체계적 변동과 비체계적 변동 > ..

데이터 분석/R 2022.03.29
728x90
반응형