Web Scraping dengan Library BeautifulSoup dan Requests


 Scraping halaman web atau dalam Bahasa Inggrisnya web scraping,  adalah teknik yang digunakan untuk mengambil isi dari sebuah halaman web secara spesifik, misalnya link, teks, gambar, tabel dan lain-lain.

Dengan bantuan library beautifulsoup dan requests, pekerjaan mengambil data dari sebuah halaman web menjadi sangat mudah. Pada artikel kali ini saya akan mempraktikkan secara sederhana mengenai cara kerja dari beautifulsoup dan requests.

Untuk mempraktekkan data scraping, kita butuh bahasa pemograman Python. Untuk itu kita perlumemastikal interopreter python sudah ter-install di komputer kita. Baik kita langsung lanjut saja ke pembahasan

Instalasi BeautifulSoup

    Pertama kita install library beautifulsoup (bs4) dengan perintah pip3.9 install bs4



Setelah muncul tulisan seperti gambar di bawah ini kita bisa langsung kelangkah selanjutnya yaitu import beautifulsoup



Import Beautifulsoup
Kemudian import beautifulsoup dengan mengetikkan from bs4 import beautifulsoup



Deklarasi html
lalu kita lakukan deklarasi html seperti gambar di bawah ini:




Deklarasi html_soup, Judul, dan Paragraf

Kemudian lakukan deklarasi html_soup, Judul, dan Paragraf seperti gambar di bawahj ini:




Display Judul dan Paragraf
    Selanjutnya kita lakukan display judul dengan mengetikkan 
print(judul)
print(paragraf)



 Setelah semua selesai kita panggil/run dan hasilnya akan muncul seperti ini



Sekian pengenalan beautifulsoup, berikutnya saya akan menjelaskan bagaimana cara menggunakan requests. Cara yang digunakan hampir sama dengan beautifulsoup

Install Requests

Pertama kita install library requests dengan perintah pip3.9 install request


jika sudah muncul tulisa seperti gambar dibawah ini, berarti install requests sudah berhasil



Import Requests

Pengetikan import requests diletakkan di bawah import beautifulsoup yg tadi kita sudah bahas di atas


untuk mempraktekkan requests ini kita memerlukan web server, maka dari itu kita harus membuat server terlebih dahulu.

Langkah pertama kita buat dulu file baru seperti ini


untuk menjalankan html ini kita perlu start servernya dan perintahnya seperti gambar di bawah ini


untuk mengetest, kita buka browser lalu lakukan seperti gambar di bawah ini:




Deklarasi Variabel html


dan ketika di panggil akan munculseperti ini




Sekian penjelasan dari saya, semoga blog ini dapat membantu anda semua. Sampai nanti di blog-blog seelanjutnya.  

Komentar

Postingan populer dari blog ini

MEMBUAT PROGRAM PESANAN MENU RESTORAN PADA PYTHON

Cara Membuat Prototype Produk