CS 공부
-
Linux 쉘 스크립트CS 공부/AI 2023. 4. 25. 20:01
서버에서 자주 사용하는 OS 무료, 오픈소스 안정성, 신뢰성 쉘 커맨드, 쉘 스크립트 CLI: Command Line Interface GUI: Graphic User Interface 대표적인 Linux 배포판 Debian: 온라인 커뮤니티에서 제작해 배포 Ubuntu: 영국 회사에서 만든 배포판, 쉽고 편한 설치, 초보자들이 접근하기 쉬움 Redhat CentOs: Redhat이 공개한 버전 가져와서 브랜드 로고 제거하고 배포 Shell Command 쉘의 종류 쉘: 사용자가 문자를 입력해 컴퓨터에 명령할 수 있도록 하는 프로그램 터미널/콘솔: 쉘을 실행하기 위해 문자 입력을 받아 컴퓨터에 전달 sh: 최초의 쉘 bash: linux 표준 쉘 zsh: Mac 카탈리나 OS 기본 쉘 쉘 UX: user..
-
파이썬 버전 관리CS 공부/AI 2023. 4. 25. 17:09
버전과 버저닝 버전: 소프트웨어 제품의 특정 release에 대한 고유한 식별자, 지속적으로 개발, 릴리즈 하는 경우 필요 버저닝: 소프트웨어의 Unique한 버전 이름, 버전 번호를 할당하는 과정 버저닝 방법 CalVer(Calender Versioning) 날짜 기반 시스템을 사용해 버전 번호를 할당 (연도와 월) 이해하기 쉬우며, 출시 시기를 예측하기 수월 ex. Ubuntu 20.04 SemVer(Semantic Versioning) 마침표로 구분된 주 번호, 부 번호, 패치 번호로 구성 이전 버전과 호환되지 않은 변경이 있는 경우 주 번호가 증가 이전 버전과 호환되며 새로운 기능이 추가되면 부 번호 증가 이전 버전의 버그 수정이 진행되면 패치 번호가 증가 ex. Python 3(주).11(부)...
-
소프트웨어 엔지니어링CS 공부/AI 2023. 4. 24. 20:08
소프트웨어의 다양한 분야 - 프론트엔드: 웹페이지의 앞단 - 백엔드: 데이터 처리, 연산, API 등을 진행 - 풀스택: 프론트엔드+백엔드 - 머신러닝, AI - 데이터 - 모바일 앱: 앱 개발 - 게임 - DevOps, 클라우드: 클라우드 리소스 효율적으로 사용 - 보안 등 소프트웨어 개발 라이프사이클 1) Planning: 계획 2) Analysis: 요구 조건 분석 3) Design: 설계 4) Implementation: 구현 5) Testing & Integration: 테스트 6) Maintenance : 유지 보수 좋은 소프트웨어 설계 1) 모듈성 레고 블록을 사용해 장난감을 만드는 것 큰 프로그램을 작고 독립적인 부분으로 나누는 것을 의미 여러 함수가 모여 하나의 모듈을 이루고, 모듈끼리 ..
-
EDA (Exploratory Data Analysis)CS 공부/Data Visualization 2023. 4. 11. 18:15
데이터 분석 데이터를 이해하기 위한 여러가지 방법 EDA 과정을 거치면서 계속해서 생기는 의문들을 해결해나가는 것이 목적 의문 해결 = 데이터 분석 Image Classification 이미지: 시각적 인식을 표현한 인공물 shape - (width, height, channel) Input과 Output 파악이 중요 Input ( image, text, sound, tabular) + model = Output ( categorical class, probability, position..) Image + Classification Model = Class 이미지를 어떤 형식으로 모델로 넣을까
-
비정형 데이터셋 시각화CS 공부/Data Visualization 2023. 4. 9. 04:10
1. dataset meta data visualization target값의 분포, target값 간의 관계 시각화 훈련 상에서 발생할 수 있는 문제점 예측 2. dataset listup only dataset: 데이터셋의 일부를 단순하게 나열 datset-target: bounding box 등의 gt, prediction 등을 정답 데이터와 비교하여 문제점 발견 가능 3. visual analytics 데이터가 고차원일 경우 관계를 쉽게 파악하기 힘들어 차원을 축소하게됨 dimension reduction(pca, lda, tsne, umap) + scatter plot (2d, 3d) 텍스트의 경우에는 word2vec등 전처리 과정을 거쳐야함 data-data relation network vi..
-
📂 3D dataset & 3D taskCS 공부/AI 2023. 4. 7. 02:28
3D가 중요한 이유? 우리가 3D 세상에 살고 있기 때문~ 3D의 활용 분야 AR/VR: 게임, 커머셜, 군사훈련 등 3D printing 의료분야, 화학분야(단백질 구조 3차원) 인간이 3d를 보는 방법 이미지는 3D 세계를 2D 공간에 투영한 것이다. 카메라는 3D 장면을 2D 이미지 평면에 투영하는 장치 = 투영된 두개의 2D 이미지로 3D를 만들어낼 수 있음 삼각측량법 (Triangulation)을 통해 2D 이미지를 3D로 만들 수 있다 3D 데이터 표현 방법 2D 이미지는 이차원 배열 구조로 각 픽셀의 RGB 값으로 표현된다 그렇다면 3D는...? Muliti-view images: 여러 각도에서 사진을 촬영 Volumetric: 2d 이미지와 가장 비슷한 표현방법 mesh: graph CNN..
-
Multi-modal learningCS 공부/AI 2023. 4. 6. 04:42
음성, 이미지, 텍스트 모두 데이터의 표현 방식이 다르다 여러modality를 사용할때 fair하게 사용하면 무조건 좋을까? NO! 학습을 하게되면 쉬운 modality에 편향되기도 한다. 어려운 데이터는 학습하지 않는 문제 Multi-modal learning 종류 Matching: 서로 다른 형태의 데이터를 하나의 space로 보내서 매칭함 Translating: 하나의 데이터를 다른 형태의 데이터로 translate Referencing: 다른 형태의 데이터 참조 Multi-modal task: Vision & Text data Text embedding 문자는 머신러닝에서 사용하기 힘들다, word mapping이 필요 두개의 단어 사이의 관계가 일반화가 가능 예를 들어 man과 woman 단어가..
-
📷 Conditional generative modelCS 공부/AI 2023. 4. 5. 03:33
Conditional generative mode Generative model과 Conditional generative model Generative model: random sample을 생성 이미지 스타일 변환, 채색화 Super resolution (저해상도 -> 고해상도) 게임 테마 바꾸기 Conditional geterative model: 주어진 조건에서 random sample을 생성 저해상도 오디오 고해상도로 바꾸기 중국어 문장 영어 문장으로 번역하기 제목과 부제목만 주고 전체 기사 글 생성 GAN(Generative Adversarial Network) Latent variable model (GAN, Diffusion model) Maximum Likelihood Learning 훈..