Analisis data ( Koleksi data : Web Scraping ) kelas X

 Buatlah sebuah ringkasan mengenai Web Scraping :

1. Pengertian Web Scraping

2. Tujuan dari Web Scraping

3. Manfaat dari Web Scraping

Setelah selesai, simpanlah hasilnya di komputer server.


lokasi tempat menyimpan file kalian : 

SAVE AS ==> KLIK BROWSE ==> KETIKAN PADA PADA FILE EXPLOLER

  \\Server\pas tik gasal 2324




Setelah di jelaskan, kamu bisa mencoba web scraping secara mandiri dengan Google Colab berikut salah satu codingan yang bisa kalian coba :


web scraping

Codingan Pertama
import requests
import pandas as pd
from bs4 import BeautifulSoup

th = "https://karirhub.kemnaker.go.id/vacancies/a82fe4b8-8c8a-40c2-8765-72af4a39ab45"
halaman = requests.get(th)
hasil = BeautifulSoup(halaman.content, 'html.parser')
print(hasil)



Codingan ke dua
import requests
import pandas as pd
from bs4 import BeautifulSoup

th="https://karirhub.kemnaker.go.id/vacancies/a82fe4b8-8c8a-40c2-8765-72af4a39ab45"
halaman=requests.get(th)
hasil=BeautifulSoup(halaman.content, 'html.parser')
lowkers=hasil.find_all(class_="single-job-ads")

posisi=[]
instansi=[]
gaji=[]

for p in lowkers:
  t1=p.select("h3")
  t2=t1[0].select("a")
  posisi.append(t2[0].get_text())

  t1=p.select("p")
  t2=t1[0].select("a")
  try:
    instansi.append(t2[0].get_text())
  except:
    instansi.append("-")
  
  t2=t1[1].select("span")
  try:
    gaji.append(t2[1].get_text())
  except:
    gaji.append(t2[0].get_text())

print(posisi)
print(instansi)
print(gaji)








Codingan ke tiga

import requests
import pandas as pd
from bs4 import BeautifulSoup

th="https://karirhub.kemnaker.go.id/vacancies/a82fe4b8-8c8a-40c2-8765-72af4a39ab45"
halaman=requests.get(th)
hasil=BeautifulSoup(halaman.content, 'html.parser')
lowkers=hasil.find_all(class_="single-job-ads")

posisi=[]
instansi=[]
gaji=[]

for p in lowkers:
  t1=p.select("h3")
  t2=t1[0].select("a")
  posisi.append(t2[0].get_text())

  t1=p.select("p")
  t2=t1[0].select("a")
  try:
    instansi.append(t2[0].get_text())
  except:
    instansi.append("-")
  
  t2=t1[1].select("span")
  try:
    gaji.append(t2[1].get_text())
  except:
    gaji.append(t2[0].get_text())

lowker = pd.DataFrame({
 “Posisi”: posisi,
 “Instansi”: instansi,
 “Gaji”:gaji
})
lowker




note "kalian bisa mengganti httpsnya dengan alamat yang akan kalian tuju."

Komentar

Postingan populer dari blog ini

KELS XII TUGAS 1 BAB 1 PROGRAM KOMPUTER (Makalah)

Tugas Kelas X Pembuatan Daftar Isi dan Video dari PPT

TUGAS 1 Kelas X JARINGAN KOMPUTER & INTERNET (Ringkasan)