본문 바로가기

Python/Web Scrapping4

<class 'bs4.element.ㅁㅁㅁ'> type() 결과 .select() for i in select(): 일 때, i .find() 2020. 7. 18.
.find_all("tr")과 .find_all("tr")[:] .find_all("tr") import requests from bs4 import BeautifulSoup url = "https://www.iban.com/currency-codes" request = requests.get(url) soup = BeautifulSoup(request.text, "html.parser") table = soup.find("table") rows = table.find_all("tr") print(type(rows)) ##### # 결과: .find_all("tr")[1:] import requests from bs4 import BeautifulSoup url = "https://www.iban.com/currency-codes" request = requests... 2020. 7. 18.
string, strip()을 이용한 문자 추출과 정리 string - 태그(tag) 내 문자열을 반환 - 태그 내에 하위 태그가 두개 이상일 경우 무엇을 반환해야 하는지 명확하지 않기 때문에 None을 반환 - 태그 내에 하위 태그가 하나이고 그 안에 문자열이 존재할 경우 해당 문자열을 반환 strip([charset]) - ()안에 입력한 문자의 양쪽에 있는 모든 조합을 제거. - 공백일경우 공백을 제거 lstrip([chars]) - 왼쪽에 있는 조합만을 제거 rstrip([chars]) - 오른쪽의 조합만을 제거 아래에 보이는 HTML에서 Boxy Charm을 .string으로 추출하려고 할 때 #HTML 2020. 4. 2.
1. requests와 beautifulsoup requests : HTTP for Humans python에는 기본적으로 requests와 비슷한 기능을 하는 *urllib라이브러리를 지원하지만 requests모듈이 사용하기 쉽고 간단하게 되어있다고 생각한다. *urllib : [https://docs.python.org/3/library/urllib.html] 1. 설치 및 import pip install requests import requests 2. 사용방법 get res = requests.get(" 얻고자 하는 사이트 url ") # 해당 url의 html정보를 요청한다. status_code res.status_code # 해당 url에 요청을 했을 때의 상태코드가 반환된다. 200이 리턴될 경우, ok라는 뜻이다. 400번대는 클라이.. 2020. 4. 1.