본문 바로가기
  • Survival Plan

Python9

머신러닝을 어떻게 시작할것인가? 머신러닝에 대한 질문으로 아래와 같은 문의 사항을 많이 듣습니다. 제가 머신러닝을 사용해 보려고 하는데, 어디에 사용해야 하나요? 제 분야에 머신러닝을 사용해 보려고 하는데, 어디에서부터 손 데야 할지 모르겠습니다... 사실, 위 같은 질문을 받으면,, 저도,,, 멍.......................... 위 질문의 직설적이 답변을 드리면, 머신러닝에 대한 최소한의 이해를 키우시라... 라고 답변을 먼저 드려야 할것 같습니다. [Machine Learning Process] 우선, 머신러닝 관련 프로세스는 아래와 같습니다. 굳이 교과서적으로 표현한다면 아래와 같습니다. ① 목표 설정 (머신러닝으로 하고 싶은일이 무엇인가?) - 목표, 예상 알고리즘, 그에 따른 데이터 셋 설계 - ex) . 목표 .. 2020. 3. 15.
[Python] 파일 해쉬 (hash) 및 Strings 기능 업무를 하다가 누군가 보안 관련 문의를 해 온적이 있었다. 암호 및 주요 민감 정보는 암호화를 하는 것이 아니라 HASH를 해야 한다고 답변을 해준 적이 있었는데, 특히, SHA-1 이상 SHA-256을 사용하면 좋다는 가이드를 해 주었다. 그랬더니, HASH 를 어떻게 하냐고 묻더라... ㅜ_ㅜ 그래서 아래처럼 간략히 코딩해서 참고만 하라고 보내준 적이 있었는데, 기억이 남아서 기록해 둔다. 좀 시간이 지난 이야기라서 이제는 해쉬라이브러리가 각 언어에서 일반화 되었지만, 사람이 모든것을 기억하고 살기에는 뇌용량이 아깝다. 기억할 필요 없는 것은 좀 적어두고 살자... ^^;;; import sys import hashlib import re def md5(in_file): m = hashlib.md5(.. 2020. 3. 10.
[Python] 딕셔너리를 데이터 프레임으로 (Dict to DataFrame) 파이썬 딕셔너리 to 데이터 프레임 파이썬으로 데이터를 분석하면서 딕셔너리 데이터 타입을 취급하는 경우가 빈번하게 발생한다. 대표적으로 웹에서 가져온 JSON 타입들이 바로 그 예이다. JSON으로 부터 적절하게 파싱을 했다고 하더라도, 파이썬의 데이터 분석 라이브러리인 Pandas로 읽어 들여 처리하려면, DataFrame형태로 변경해 주어야 한다. 데이터 분석을 잘하는 사람도, 파이썬 자체를 잘하는 사람도, Pandas의 딕셔너리를 데이터프레임으로 변환하는 작업을 잘 해보지 않았다면 많으 시간을 허비하게 될 것이다. 따라서, 오늘은 Dict to DataFrame에 대해서 거론해 보도록 한다. pandas.DataFrame에 dictToDataFrame 같은 함수가 있으면 좋으련만, dict 라는 타.. 2020. 3. 10.