Web Scraping dengan Library BeautifulSoup dan Requests
Scraping halaman web atau dalam Bahasa Inggrisnya web scraping, adalah teknik yang digunakan untuk mengambil isi dari sebuah halaman web secara spesifik, misalnya link, teks, gambar, tabel dan lain-lain.
Dengan bantuan library beautifulsoup dan requests, pekerjaan mengambil data dari sebuah halaman web menjadi sangat mudah. Pada artikel kali ini saya akan mempraktikkan secara sederhana mengenai cara kerja dari beautifulsoup dan requests.
Untuk mempraktekkan data scraping, kita butuh bahasa pemograman Python. Untuk itu kita perlumemastikal interopreter python sudah ter-install di komputer kita. Baik kita langsung lanjut saja ke pembahasan
Instalasi BeautifulSoup
Pertama kita install library beautifulsoup (bs4) dengan perintah pip3.9 install bs4
Setelah muncul tulisan seperti gambar di bawah ini kita bisa langsung kelangkah selanjutnya yaitu import beautifulsoup
print(judul)print(paragraf)
Setelah semua selesai kita panggil/run dan hasilnya akan muncul seperti ini
Sekian pengenalan beautifulsoup, berikutnya saya akan menjelaskan bagaimana cara menggunakan requests. Cara yang digunakan hampir sama dengan beautifulsoup
Install Requests
Pertama kita install library requests dengan perintah pip3.9 install request
jika sudah muncul tulisa seperti gambar dibawah ini, berarti install requests sudah berhasil
Import Requests
Pengetikan import requests diletakkan di bawah import beautifulsoup yg tadi kita sudah bahas di atas
untuk mempraktekkan requests ini kita memerlukan web server, maka dari itu kita harus membuat server terlebih dahulu.
Langkah pertama kita buat dulu file baru seperti ini
untuk menjalankan html ini kita perlu start servernya dan perintahnya seperti gambar di bawah ini
untuk mengetest, kita buka browser lalu lakukan seperti gambar di bawah ini:
Sekian penjelasan dari saya, semoga blog ini dapat membantu anda semua. Sampai nanti di blog-blog seelanjutnya.
Komentar
Posting Komentar