본문 바로가기

데이터분석6

[텍스트 마이닝-시각화] 워드클라우드 만들기 패키지 임포트import pandas as pd from wordcloud import WordCloud, ImageColorGenerator from PIL import Image import matplotlib.pyplot as plt import numpy as np from PIL import * 단어명과 빈도가 있는 데이터 불러오기df = pd.read_csv("저장경로/파일명.txt", sep='\t', encoding='UTF-8') df 단어명과 빈도로 딕셔너리 객체 생성. (단어 개수가 많을 경우 적당량만 새 데이터프레임에 담아서 사용해도 됨.)dict = dict(zip(list(df['명사']), list(df['빈도']))) dict 워드 클라우드를 만들고 싶은 모양이 있을 경우 이.. 2023. 12. 27.
[코딩 테스트] Python - 입문 - Day7, Day8 프로그래머스 코딩테스트 입문 7일차: 문자열, 조건문, 수학, 반복문 1. 특정 문자 제거하기def solution(my_string, letter): answer = my_string.replace(letter, '') return answer 2. 각도기def solution(angle): if angle > 0 and angle 90 and angle < 180: answer = 3 elif angle == 180: answer = 4 return answer 3. 양꼬치def solution(n, k): answer = (12000*n) + 2000*(k-(n//10)) return answer.. 2023. 7. 25.
TWBX5기 2차 개인 과제: '23 봄 월별 따릉이 인기 대여소 대시보드 아래 이미지를 클릭하면 태블로 퍼블릭으로 이동합니다. : ) 👀 활용 데이터 목록 - 공공데이터포털 활용 1. 서울시 따릉이 대여소 마스터 정보 2. 서울시 따릉이 대여소별 대여/반납 승객수 정보 23년 3월 따릉이 대여소별 이용 현황(일별/대여소별) 23년 4월 따릉이 대여소별 이용 현황(일별/대여소별) 23년 5월 따릉이 대여소별 이용 현황(일별/대여소별) ✅ 데이터 전처리 1. 월별로 결합한 대여소별 대여/반납 데이터를 ['시작_대여소_ID', '종료_대여소_ID']로 그룹화 2. 시작 대여소 ID와 종료 대여소 ID가 같은 행 삭제 (경로가 아니기 때문) 3. ['전체 건수'] 합계를 기준으로 내림차순 정렬 후 상위 100개만 추출 📊 데이터 시각화 1. 대여소의 위도, 경도를 태블로 맵 데이터로.. 2023. 7. 20.
TWBX5기 1차 개인 과제: '23 봄 월별 따릉이 대여 현황 대시보드 아래 이미지를 클릭하면 태블로 퍼블릭으로 이동합니다. : ) 👀 활용 데이터 목록 - 공공데이터포털 활용1. 서울시 구별 경계.shp 2. 서울시 따릉이 대여소 마스터 정보 3. 서울시 따릉이 대여소별 대여/반납 승객수 정보23년 3월 따릉이 대여소별 이용 현황(일별/대여소별)23년 4월 따릉이 대여소별 이용 현황(일별/대여소별)23년 5월 따릉이 대여소별 이용 현황(일별/대여소별) ✅ 데이터 전처리1. 일별로 나뉜 데이터를 각 월마다 결합 2. ['시작_대여소_ID']를 기준으로 그룹화 후 ['전체 건수'] 합계 계산 3. ['전체 건수'] 기준 내림차순 정렬 4. ['시작_대여소_ID']와 ['대여소_ID']를 기준으로 대여소의 위도, 경도 추가(서울시 따릉이 대여소 마스터 정보) 📊 데이터 시각화1.. 2023. 7. 16.
TWBX5기_3차 학습: 세일즈 기본 대시보드 아래 이미지를 클릭하면 태블로 퍼블릭 대시보드로 이동합니다. : ) 2023. 7. 13.
TWBX5기_2차 학습: 주식 차트 대시보드 만들기 아래 이미지를 클릭하면 태블로 퍼블릭 대시보드로 이동합니다. : ) 2023. 7. 13.
728x90