ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터 시각화
    CS 공부/Data Visualization 2023. 3. 23. 23:06
    • 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것

     

    데이터셋의 종류


    • 정형 데이터 : 테이블 형태(csv,tsv)
      • Row=item, Column=attribute(feature)
      • 통계적 특성과 feature 사이의 관계, 데이터 간 관계, 데이터 간 비교

     

    • 시계열 데이터: 시간 흐름에 따른 데이터(time-series)
      • 기온, 주가 등 정형데이터와 음성, 비디오 같은 비정형 데이터
      • 시간 흐름에 따른 추세, 계절성, 주기성

     

    • 지리 / 지도 데이터: 지도 정보와 보고자하는 정보와의 조화, 단순화
      • 거리, 경로, 분포 등

     

    • 관계 데이터: 객체와 객체 간의 관계 시각화, 관계의 가중치 표현
      • 객체=node, 관계=link
      • Heuristics하게 노드 배치 구성

     

    • 계층적 데이터: 관계 중에서도 포함관계가 분명한 데이터 (회사 조직도, 가계도)
      • 네트워크 시각화로도 표현 가능 
      • Tree, Treemap, Sunburse

     

    데이터의 종류


    • 수치형 (수로 표현 가능)
      • 연속형(continuous): 길이, 무게, 온도 
      • 이산형(discrete): 주사위 눈금, 사람 수
    • 범주형 (수치가 비례적이지 않음)
      • 명목형(norminal): 혈액형, 종교, mbti
      • 순서형(ordinal): 학년, 별점, 등급

     

    시각화


    • mark: 점, 선, 면으로 이루어진 데이터 시각화
    • channel: 각 마크를 변경할 수 있는 요소들(평행, 수직 이동, 모양 바꾸기, 길이,색 변경 등)
    • 전주의적 속성(pre-attentive attribute): 주의를 주지 않아도 인지하게 되는 요소. But! 동시에 사용하면 인지하기 어려움. 적절하게 사용할 때 시각적 분리

    전주의적 속성들

    'CS 공부 > Data Visualization' 카테고리의 다른 글

    Matplotlib 시각화 요소 (Text, Color, Facet)  (0) 2023.03.27
    Scatter plot  (0) 2023.03.26
    Line plot  (0) 2023.03.26
    Bar plot  (0) 2023.03.25
    Matplotlib 기초 (그래프 틀, 막대그래프 그리기, annotate)  (0) 2023.03.24
Designed by Tistory.