Analisis data ( Koleksi data : Web Scraping ) kelas X
Buatlah sebuah ringkasan mengenai Web Scraping :
1. Pengertian Web Scraping
2. Tujuan dari Web Scraping
3. Manfaat dari Web Scraping
Setelah selesai, simpanlah hasilnya di komputer server.
lokasi tempat menyimpan file kalian :
SAVE AS ==> KLIK BROWSE ==> KETIKAN PADA PADA FILE EXPLOLER
\\Server\pas tik gasal 2324
Setelah di jelaskan, kamu bisa mencoba web scraping secara mandiri dengan Google Colab berikut salah satu codingan yang bisa kalian coba :
web scraping Codingan Pertama
import requests import pandas as pd from bs4 import BeautifulSoup th = "https://karirhub.kemnaker.go.id/vacancies/a82fe4b8-8c8a-40c2-8765-72af4a39ab45" halaman = requests.get(th) hasil = BeautifulSoup(halaman.content, 'html.parser') print(hasil) Codingan ke dua
import requests import pandas as pd from bs4 import BeautifulSoup th="https://karirhub.kemnaker.go.id/vacancies/a82fe4b8-8c8a-40c2-8765-72af4a39ab45" halaman=requests.get(th) hasil=BeautifulSoup(halaman.content, 'html.parser') lowkers=hasil.find_all(class_="single-job-ads") posisi=[] instansi=[] gaji=[] for p in lowkers: t1=p.select("h3") t2=t1[0].select("a") posisi.append(t2[0].get_text()) t1=p.select("p") t2=t1[0].select("a") try: instansi.append(t2[0].get_text()) except: instansi.append("-") t2=t1[1].select("span") try: gaji.append(t2[1].get_text()) except: gaji.append(t2[0].get_text()) print(posisi) print(instansi) print(gaji) Codingan ke tiga
import requests import pandas as pd from bs4 import BeautifulSoup th="https://karirhub.kemnaker.go.id/vacancies/a82fe4b8-8c8a-40c2-8765-72af4a39ab45" halaman=requests.get(th) hasil=BeautifulSoup(halaman.content, 'html.parser') lowkers=hasil.find_all(class_="single-job-ads") posisi=[] instansi=[] gaji=[] for p in lowkers: t1=p.select("h3") t2=t1[0].select("a") posisi.append(t2[0].get_text()) t1=p.select("p") t2=t1[0].select("a") try: instansi.append(t2[0].get_text()) except: instansi.append("-") t2=t1[1].select("span") try: gaji.append(t2[1].get_text()) except: gaji.append(t2[0].get_text())lowker = pd.DataFrame({ “Posisi”: posisi, “Instansi”: instansi, “Gaji”:gaji }) lowkernote "kalian bisa mengganti httpsnya dengan alamat yang akan kalian tuju."
Komentar
Posting Komentar