목록전체 글 (41)
견리더의 알(R)파(Python)고
오늘 청춘시대 드라마를 끝까지 봤다. 여자들끼리 같은 집에 살며 일어나는 에피소드를 나열하며 이야기가 전개되며, 각 인물들의 숨겨진 이야기가 드라마의 큰 줄기를 이룬다. 드라마를 보면서 송지원이라는 캐릭터에 대해 내가 느낀점을 적어봐야겠다. 가장 느낀게 많은 캐릭터는 송지원이라는 캐릭터다. 시즌 1에는 송지원에 대한 숨겨진 이야기가 많이 나오진 않지만, 그 캐릭터를 보면서 느낀 것이 많다. 지금 느낀점은 송지원이라는 캐릭터의 성격이다. 활발하며 속칭 광대역할을 맡는다. 그러면서 가지각색의 다른 캐릭터를 이어주는 윤활유 같은 성격이다. 그러한 성격 때문에 유은재의 존경을 받으며, 유은재의 숨겨진 이야기를 많이 듣는다. 그 숨겨진 이야기는 22살 송지원도 감당할 수 없는 이야기였고, 송지원은 이렇게 말한다...
KoNLP는 정말 R에서도 python에서도 정말 깔기 힘들다.... 자연어 분석의 시간 소요비율은 패키지 깔기 90% 분석 10%라고 해도 무방하다. 일단 기본적으로 되어 있어야 하는 것은 java환경변수 설정과, RTools설치이다. 참고하기 좋은 사이트는 1. java 환경변수 설정 R 크롤링 rjava 설치하기 :: R/Python은 겉치레가 아니야 (tistory.com)
db와 파이썬 연결하기 import pandas as pd import pymysql from sqlalchemy import create_engine host_url = "db.ds.*****.***" user_nm = "******" passwd = "********" port_num = ******* db_name = "********" #스키마 이름 engine = create_engine(f'mysql+pymysql://{user_nm}:{passwd}@{host_url}:{port_num}/{db_name}?charset=utf8mb4') engine_conn = engine.connect() # 테이블 명 수정 후 진행 upload_df.to_sql("table_name", engine_co..
# null값인 것만 가져오기 df[df['col'].isnull()] # null값이 아닌 것만 가져오기 df[df['col'].notnull()] 간단하지만 검색이 귀찮을 때 정리.
# 5로 나올경우 word = '태연' len(word) >>> 5 # 수정 방법 import unicodedata word = '태연' re_word = unicodedata.normalize('NFC', word) len(re_word) >>> 2
아오 또 아프다.... 집에 항상 근육이완제가 있다. 허허 항상 인터넷에 검색해본다 담걸릴때 스트레칭, 담 걸림 이런 것들 하지만 항상 한의원 광고만 날 받겨줄 뿐이다.. 오늘도 검색하며 담 통증을 즐기고(?) 있었는데, 어느 한 포스팅, 아니 어떤 만화가 나에게 빛을 내 주었다. https://moneyonmymind.tistory.com/64 목에 담 걸렸을 때 약 없이 해결하는 간단한 방법! 목에 담걸렸을 때 약 없이 해결하는 방법은? 담이 걸리게 되면 일단 일상생활 불가능입니다. 그래서 먼저 해결하는 것이 좋습니다. 저 또한 담에 걸릴 때마다 너무 힘들어서 여러가지 정보를 찾 moneyonmymind.tistory.com 여기다 여기! 여기에 담 스트레칭이 만화로 나와있는데 이대로 해보니 통증이 ..
데이터 칼럼 바꾸기!! 1. 전체적으로 수정하기 df.columns = ['col1', 'col2', 'col3'] 이런식으로~~ 주의) 칼럼수 맞춰줘야 함 2. 부분만 수정하기 ex) 'col1' 이름을 'new_col1'로 바꾸고 싶을 때 df.rename(columns = {'col1': 'new_col1'})
후.... 구글검색을 셀레니움하기엔 역시 쉽지 않다. 로봇이 불규칙적으로 뜨기 때문이다 여러 옵션을 막 넣어봤지만 막힐때가 많았다. 그래서 생각해낸건... 구글 검색을 바로 들어가기전에 다른 사이트를 들렸다 가는것이다. 코드를 올려보자 import requests import pandas as pd import pymysql import time from bs4 import BeautifulSoup as bs from sqlalchemy import create_engine from tqdm.notebook import tqdm from selenium.webdriver.chrome.options import Options from webdriver_manager.chrome import ChromeDr..
물론 젠심 사이트에 있지만 내가 자주 쓰는 메서드를 차례로 추가 하도록 하자 word 와 코사이 유사도가 가장 높은 단어 10개를 추출한다. embedding_model.wv.most_similar('word', topn = 10) word1과 word2 사이의 코사인 유사도를 측정한다. embedding_model.wv.similarity('word1', 'word2') 벡터화가 된 단어들을 불러온다 embedding_model.wv.index_to_key word에 해당하는 벡터값을 불러온다 embedding_model.wv.['word'] 나중에 더 추가 해야겠다..
오마이 갓 주피터보다 파이참이 더 좋다고 생각한 내가 이 블로그를 보고 생각이 바뀌었따.... 주피터 노트북의 꿀팁들. jupyter notebook을 사용할 때 활용할만한 꿀팁들을… | by John | Medium 주피터 노트북의 꿀팁들 jupyter notebook을 사용할 때 활용할만한 꿀팁들을 공유하려고 한다. john-analyst.medium.com 지린다 지려 qgid는 필터 효과도 누릴 수 있따...! 처음 보는 데이터의 구조를 파악할 때 유용할 것 같습니다. ㅎㅎㅎ