CS 공부/Data Visualization
-
Matplotlib 시각화 요소 (Text, Color, Facet)CS 공부/Data Visualization 2023. 3. 27. 03:01
Text Title: 제목/주제 Label: 축에 해당하는 데이터 정보 Tick label: 축에 눈금을 사용하여 단위 정보 추가 Legend: 범례 Annotation: 그 외 시각화에 대한 설명 fig, ax = plt.subplots() fig.suptitle('Figure Title') ax.plot([1, 3, 2], label='범례') ax.legend() ax.set_title('제목입니다') ax.set_xlabel('X축 라벨') ax.set_ylabel('Y축 라벨') ax.text(x=1,y=2, s='좌표 기반 텍스트') fig.text(0.5, 0.6, s='전체 크기 비율 텍스트') plt.show() fontstyle: normal, italic, oblique weight:..
-
Scatter plotCS 공부/Data Visualization 2023. 3. 26. 17:36
Scatter plot 두 점을 사용하여 두 특성간의 관계를 알기 위해 사용 (상관 관계를 확인하기 위해) 산점도- 인과 관계와 상관 관계는 다르다! 직교 좌표계에서 x축/y축에 feature값 매핑 .scatter() 사용 '/' 모양이면 긍정적인 관계, '\'모양이면 부정적인 관계, 둘다 아니면 상관성 없음 추세선을 사용하면 scatter의 패턴을 유추할 수 있다 (한개만 사용하는 것 추천) 범주형이 포함된 관계에서는 heatmap 또는 bubble chart를 추천한다 scatter plot의 요소 색(color): 연속은 gradient, 이산은 개별 색상으로 모양(marker): 거의 구별하기 힘들고 어느 것이 더 큰지 구별안됨 크기(size): 크기가 다른 차트를 bubble chart라고 부..
-
Line plotCS 공부/Data Visualization 2023. 3. 26. 17:02
Line plot 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프 꺾은선 그래프, 선 그래프, line chart, line graph 시계열 분석에 특화됨! (시간/순서에 대한 변화) .plot() (.line아님!!) 5개 이하의 선을 사용하는 것을 추천 시시각각 변동하는 데이터는 noise로 인해 추세 파악이 어려워서 noise 방해를 줄이기 위해 smoothing 사용 규칙적인 간격의 데이터가 아니라면 각 관측 값에 점으로 표시해서 오해를 줄이자! 범례 대신 라인 끝 단에 레이블을 추가하는 것을 추천! Min/Max 정보나 원하는 포인트는 annotation을 추가해주는 것이 도움 됨 보다 연한 색을 사용하여 uncertainty(신뢰구간, 분산 등) 표현 가능 Li..
-
-
Matplotlib 기초 (그래프 틀, 막대그래프 그리기, annotate)CS 공부/Data Visualization 2023. 3. 24. 12:04
import import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt #기본 그래프 틀 fig = plt.figure(figsize=(x,y)) # figsize로 ax의 size 조정 ax = fig.add_subplot() plt.show() # 그래프 여러개 동시에 출력하려면 fig = plt.figure() ax = fig.add_subplot(1, 2, 1) # 세로로 두개 plt.show() 객체지향(Object-Oriented) API : 그래프에서 각 객체에 대해 직접적으로 수정하는 방법 ex. plt.plot(x1) (X) , ax.plot(x1) (O) fig = plt.figure() ax = fig.add..
-
데이터 시각화CS 공부/Data Visualization 2023. 3. 23. 23:06
데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것 데이터셋의 종류 정형 데이터 : 테이블 형태(csv,tsv) Row=item, Column=attribute(feature) 통계적 특성과 feature 사이의 관계, 데이터 간 관계, 데이터 간 비교 시계열 데이터: 시간 흐름에 따른 데이터(time-series) 기온, 주가 등 정형데이터와 음성, 비디오 같은 비정형 데이터 시간 흐름에 따른 추세, 계절성, 주기성 지리 / 지도 데이터: 지도 정보와 보고자하는 정보와의 조화, 단순화 거리, 경로, 분포 등 관계 데이터: 객체와 객체 간의 관계 시각화, 관계의 가중치 표현 객체=node, 관계=link Heuristics하게 노드 배치 구성 계층적 데이터: 관계 중에서도 포함관계가 분명한 데이터 (..