PYTHON 11

[파이썬]google-play-scraper 라이브러리로 크몽 앱 리뷰 크롤링하기

구글 플레이 스토어의 앱 사용자 리뷰를 크롤링하여 데이터를 수집하고자 하는 분들이 많습니다. 이번 글에서는 크몽 앱의 최신 사용자 리뷰 데이터를 크롤링하는 간단한 방법을 설명드리겠습니다. 1. 파이썬 크롤링 라이브러리 설치'google-play-scraper' 라이브러리는 파이썬에서 구글 플레이 스토어의 앱 리뷰 데이터를 손쉽게 수집할 수 있도록 도와줍니다. 설치 방법은 다음과 같습니다.!pip install google-play-scraper  https://pypi.org/project/google-play-scraper/ google-play-scraperGoogle-Play-Scraper provides APIs to easily crawl the Google Play Store for Pytho..

카테고리 없음 2025.03.24

1072번째 오늘의 꼬맨틀 정답 유사단어 크롤링

꼬맨틀은 오늘의 단어를 맞히는 게임입니다. 정답 단어를 추측하면, 추측한 단어가 정답 단어와 얼마나 유사한지 유사도 점수로 알려줍니다. https://semantle-ko.newsjel.ly/ 꼬맨틀 - 단어 유사도 추측 게임 - 뉴스젤리 : 데이터 시각화 전문 기업하루에 한 번, 오늘의 단어를 맞혀보세요. 단어를 입력하면 정답 단어와의 유사도를 보여줍니다.semantle-ko.newsjel.ly  1072번째 꼬맨틀의 정답 단어는 '서류'였었습니다.첫 단어를 '물건'을 썼었는데, 1000번 안에 들면서 재밌게 플레이했었네요. 정답을 맞히거나, 문제 풀이를 포기한다면 상위 1000개의 단어를 확인할 수 있게 됩니다. 그런데 이 유사한 단어 목록은 3일 제공하고 그 뒤에는 접근할 수 없게 됩니다. 그래서 ..

카테고리 없음 2025.03.09

Python으로 직방 크롤링한 데이터 전처리하기

https://written-memories.tistory.com/entry/%EC%A7%81%EB%B0%A9-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%81%AC%EB%A1%A4%EB%A7%81%ED%95%98%EA%B8%B0-Python-Selenium 직방 데이터 크롤링하기 - Python Selenium사람이 살아가는 데 필수적인 의식주 중에서 주거는 가장 기본적인 생활 요소입니다.그래서 '크롤링해볼까?' 생각이 들어하게 되었습니다.직방 선정 이유부동산 플랫폼은 네이버부동산, 다방,written-memories.tistory.com 이전글에서 이어집니다. df_01 = pd.read_excel("직방_01.xlsx")df_02 = pd.read_excel("직방_02.xlsx")df..

카테고리 없음 2025.03.07

직방 데이터 크롤링하기 - Python Selenium

사람이 살아가는 데 필수적인 의식주 중에서 주거는 가장 기본적인 생활 요소입니다.그래서 '크롤링해볼까?' 생각이 들어하게 되었습니다.직방 선정 이유부동산 플랫폼은 네이버부동산, 다방, 직방, 부동산플래닛 등 다양하게 있습니다. 최초에는 특정 지역에서의 부동산 월세 매물을 가져오려 했으나,특정 지역 한정해서 클릭과 크롤링을 진행하기란, 생각보다어려운 일이었습니다. 고민을 하더 찰나 찾은 것이매물번호를 기준으로 크롤링을 하는 것입니다.https://www.zigbang.com/home/oneroom/items/43932924 매물번호로 url에 접속하면 다음과 같은 창이 뜨게 됩니다. 우측에 매물에 대한 정보가 존재하는데, 스크롤을 내리면 추가정보를 알 수 있습니다. 다행히 스크롤을 하지 않아도 html에 ..

카테고리 없음 2025.03.07

[Python 자동클릭] pyautogui로 화면을 인식해 버튼 누르기

컴퓨터를 사용하다 보면 반복적인 클릭 작업이 필요할 때가 많습니다.예를 들어:✔️ 특정 버튼을 자동으로 클릭✔️ 게임에서 반복 작업 수행✔️ 프로그램 UI를 자동 조작이럴 때 Python의 pyautogui를 활용하면 간단하게 자동 클릭을 구현할 수 있습니다.먼저 필요한 라이브러리를 설치합니다.!pip install pyautogui!pip install opencv-pythonpyautogui: 마우스, 키보드 자동화 (매크로)opencv-python: 이미지 인식 (화면에서 특정 이미지를 찾을 때 필요)opencv 는 pyautogui의 이미지 인식 기능을 사용하기 위해 필요합니다. 네이버의 '증권' 버튼을 찾아 클릭하고,네이버 증권에서 '국내증시'를 찾아 클릭하려 합니다.  # 증권 이미지 찾기A ..

카테고리 없음 2025.03.03

Python : 삼성전자 시세 크롤링

안녕하세요.이번에는 Python을 활용해 삼성전자 주가 시세 데이터를 크롤링해보려 합니다. https://finance.naver.com/item/main.naver?code=005930 삼성전자 - 네이버페이 증권 : 네이버페이 증권관심종목의 실시간 주가를 가장 빠르게 확인하는 곳finance.naver.com네이버페이 증권 - 삼성전자에서 진행합니다. 삼성전자 시세탭에 들어갑니다. 시세탭에서 아래로 스크롤을 하면, 시간별 시세와 일별시세가 나오게 됩니다. 이를 개발자도구 F12, 또는 우클릭 - 검사를 통해 html을 확인하면, 각각 시간별시세는 https://finance.naver.com/item/sise_time.naver?code=005930&thistime=20250227161055&page..

카테고리 없음 2025.02.27

Python과 Selenium을 활용한 웹페이지 스크롤 내리기

Python과 Selenium을 이용하여 웹페이지에서 스크롤을 내리는 3가지 방법을 소개하려고 합니다. JavaScript 실행을 통한 스크롤키 이벤트(PAGE_DOWN) 전송을 통한 스크롤키 이벤트(END 키) 전송을 통한 스크롤 1. JavaScript 실행을 통한 스크롤 from selenium import webdriverimport undetected_chromedriver as ucdriver = uc.Chrome()driver.get('https://shopping.naver.com/fresh/directfarm/home')time.sleep(1)# 자바스크립트를 실행하여 페이지의 맨 아래로 스크롤합니다.driver.execute_script('window.scrollTo(0, documen..

카테고리 없음 2025.02.27

역대 당첨 번호를 제외한 로또 숫자

이 글은'로또를 살 때, 역대 1,2,3, 등에 해당하는 숫자를 제외한다면,조금이나마 확률이 올라가지 않을까? 라는 생각에서 시작됩니다. 물론 각각의 로또 회차는 독립적이어서 서로에게 영향을 주지 않지만,'이미 당첨된 로또번호가 또 다시 당첨되지 않을 것이다!'라는 생각 또한 포함하고 있습니다.1회부터 1160회차의 로또 번호 기록입니다. 동행복권에서 발매되는 로또는 45개의 숫자 중에 6개를 맞춰야 합니다.이때, 맞춘 번호의 갯수에 따라 등수가 결정됩니다.1등: 메인 번호 6개 모두 일치2등: 메인 번호 5개 일치 + 보너스 번호 포함3등: 메인 번호 5개 일치 (보너스 번호 미포함)4등: 메인 번호 4개 일치 (보너스 번호 미포함)5등: 메인 번호 3개 일치 (보너스 번호 미포함)여기서는 1,2,3등..

카테고리 없음 2025.02.24

로또 당첨 번호 크롤링 (Daum, Naver)

다음에서 로또 당첨 번호를 가져오려고 합니다.https://search.daum.net/search?w=tot&q=%EB%A1%9C%EB%98%90+%EB%8B%B9%EC%B2%A8+%EB%B2%88%ED%98%B8&DA=EKS F12를 누르거나  해당위치에서 우클릭 -> 검사로 html을 확인할수 있습니다. 다음 같은 경우는 div 'lottonum' 에서번호를 말고 필요없는 '보너스'를 제거하기위해 del box[6:8]을 사용하였습니다.import requests # 페이지 요청from bs4 import BeautifulSoup # html 소스코드를 파이썬으로 다룰 수 있게 변환import time # sleep 대기시간from tqdm import tqdm # for 문 작업 시간 기기impo..

카테고리 없음 2025.02.24

programmers 비밀지도 Python

Q 네오는 평소 프로도가 비상금을 숨겨놓는 장소를 알려줄 비밀지도를 손에 넣었다. 그런데 이 비밀지도는 숫자로 암호화되어 있어 위치를 확인하기 위해서는 암호를 해독해야 한다. 다행히 지도 암호를 해독할 방법을 적어놓은 메모도 함께 발견했다. 1. 지도는 한 변의 길이가 n인 정사각형 배열 형태로, 각 칸은 "공백"(" ") 또는 "벽"("#") 두 종류로 이루어져 있다. 2. 전체 지도는 두 장의 지도를 겹쳐서 얻을 수 있다. 각각 "지도 1"과 "지도 2"라고 하자. 지도 1 또는 지도 2 중 어느 하나라도 벽인 부분은 전체 지도에서도 벽이다. 지도 1과 지도 2에서 모두 공백인 부분은 전체 지도에서도 공백이다. 3. "지도 1"과 "지도 2"는 각각 정수 배열로 암호화되어 있다. 4. 암호화된 배열은..

카테고리 없음 2025.02.16