본문 바로가기

Programming

(92)
Rocket chat을 이용한 서버구축 Rocket.chat 홈페이지: rocket.chat/ Rocket.Chat - The Leading Communication Hub Lead with a Communication Hub that allows total control of your data. All in one platform: team collaboration, omnichannel engagement, DevOps and ChatOps. rocket.chat Rocket chat documentation: docs.rocket.chat/ Welcome to Rocket.Chat Docs Here you can find all the docs about Rocket.Chat server and client. docs.rocket.cha..
[울산 코로나맵 재오픈] 울산 확진자 동선만! 편하게 확인하세요 안녕하세요, 저는 3월 초에 울산 지역만을 대상으로 코로나맵을 개발했던 팀원입니다. [아래 글 참조] 2020/03/17 - [Programming/Web 개발] - 울산 코로나 맵 이용 가이드 울산 코로나 맵 이용 가이드 저번주에 후배들과 개발했던 울산 코로나맵이 SNS나 뉴스, 신문 등의 매체를 통해 이용자가 확산됨에 따라 유입자가 계속 발생하여 별도로 이렇게 이용가이드를 작성해보려고 합니다. 코로나 맵 kjwan4435.tistory.com 2020/03/13 - [Daily] - 울산 코로나맵 개발 후기 울산 코로나맵 개발 후기 https://coronamap-ulsan.site 울산 지역만을 대상으로 자세한 정보를 제공하기 위한 코로나맵입니다. 표기된 확진자 경로는 방역소독이 완료되었습니다. 소..
C# 문자열 백준 문제풀이 (1157, 1316, 2675, 2908, 2941, 5622) 최근 C#을 공부하면서 차근차근 기본문제들을 C#을 이용해서 풀기로 했다. 이번에 푼 챕터는 문자열 관련 챕터이며 새롭게 알게 된 개념부터 몇 개만 소개하고 정답 공유 후 포스팅을 마치겠다. c# 인풋 받기 (input read) string input = ReadLine(); // string 경우 string[] input = ReadLine().Split(); // string split해서 입력받을 경우 int input = int.Parse(ReadLine()); // int 경우 c# 배열 초기화 (array initialization) using System.Linq; int[] freq = Enumerable.Repeat(0, 32).ToArray(); // 32개의 0값을 가지는 배열 생..
머신러닝 알고리즘 정리 (K-NN, SVM) 1. K-NN (K-nearest neighborhood) classification 알고리즘의 일종으로 user가 직접 정의하는 parameter인 K에 따라 데이터들 간의 거리를 기반으로 가까운 K개의 데이터들의 투표를 통해 분류를 진행한다. 이 때, k는 sqrt(n)보다 작은 값으로 정하며, 너무 작을 시에는 noise가 심하고(variance가 커서 신뢰도가 떨어짐), 너무 클 경우에는 다른 클래스의 데이터가 포함될 가능성이 크므로(bias가 커지므로 부정확해 질 수 있음) k를 잘 정하는 것이 중요하다. 데이터들 간의 거리는 Euclidean, Manhattan, Minkowski, correlation 등 다양한 거리 계산 방법을 활용할 수 있으며, 사전지식이나 cross-validation..
머신러닝 알고리즘 정리 (Decision Tree, Random Forest) 1. Decision Tree (결정 트리) Rull based prediction model로 Tree구조로 각 노드에서 binary 혹은 multi-way의 조건을 체크하면서 모든 응답이 거의 같은 값을 가리킬 때 까지 leaf node로 classification 혹은 regression을 하는 머신러닝 기법이다. 쉽게 설명하면 스무고개를 통해 원래 데이터가 어디에 속하는 지 알아나가는 과정이라고도 볼 수 있다. 각 노드에 질문을 통해 분류되는 클래스들은 homogenous(같은 클래스의 비중이 높을수록)할수록 좋다. 예를 들면 어떤 질문을 통해 5:5로 나누어지는 것 보다는 9:1로 나눌 수 있는 것이 좋다는 것이다. 다시 말해 각 영역의 순도(homogeneity)가 높을 수록, 불순성(Node..
머신러닝 알고리즘 정리 (PCA, LDA) 1. PCA (Principal Component Analysis) Unsupervised learning의 일종으로, independent variable들 사이에 correlation을 없애고, 숨은 latent variable을 찾아내거나, 노이즈(noise)를 줄일 때 사용한다. PCA를 돌린 후 나오는 값들은 다음의 의미를 가진다. PC(eigenvector) : 기존 변수들로 이루어진 선형 벡터이며, 기존의 변수들을 설명한다. PC loadings: 기존 변수들과 PC사이의 correlation 값으로, 해당 PC로 기존의 변수들을 얼마나 잘 설명하는 지 percentage로 보여준다. PC score: 각각의 PC에 대해서 재 생성된 observation data들이다. (latent var..
머신러닝 알고리즘 정리 (Linear regression, Logistic regression) 0. Supervised vs Unsupervised Learning 간단히 말해 labeled data, 즉 타겟 변수(target variable)의 존재유무로 판단한다. 0-1. Supervised Learning labeled data가 존재하여, 정답을 알려주면서 training set를 이용하여 학습한 후, test set이나 inner validation을 통해 알고리즘 별 적합한 score를 계산하여 성능을 비교하는 것. ex) Linear regression, Logistic regression, Linear discriminant analysis(LDA), Decision Tree, Random Forest, K nearest neighborhood(K-NN), Supprot vecto..
Z-test, T-test, Paired T-test, ANOVA test 비교 기본 개념 정리. The Central Limit Theorem(중심 극한 정리) 만약, y1...yn이 i.i.d(independent, identically distributed), E(yi)=u, Var(yi) = sigma^(2)이고, x = y1+y2+...yn일 때, Zn = (x-n*u)/sqrt(n*sigma^(2)) = (x/n - u)/sqrt(sigma^(2)/n)은 n이 무한으로 발산할 때 정규분포를 따른다. (표본이 커질수록, 표본 평균의 분포는 모집단의 분포와는 상관없이 정규분포에 가까워진다. 이때, 표본 평균의 평균은 u이고, 분산은 모분산에 n을 나눈 것과 같다.) Chi-분포 만약, Z1...Zk가 independent random variable이며 정규분포를 따를 때, ..