Hallo Guys 😂
Kali ini aku akan membagikan tutorial parsing data atau / scraping dengan python
di android
Sebelum itu bantu author Dengan Click iklan dan biarkan beberapa detik ya gan ya , semoga author tambah semangat untuk memperbarui artikel di blog ini setiap hari
Kita Akan Mencoba parsing Dari Blog Page Saya ini Contoh Page
siap kan dulu peralatanya
- Termux :
pkg install python pip install requests pip install bs4
ok pribadi saja kita sanksi kegiatan nya pertama buka dulu quick edit atau nano editor
Tampilan Untuk Quick Edit
Tampilan Untuk Nano Editor (tools bawaan termux)
Selanjutnya import dulu module requests dan bs4
import requests from bs4 import BeautifulSoup url = 'https://xomlic.blogspot.comp/belajar-bs4.html?m=1' with requests.Session() as c: respon = c.get(url) soup = BeautifulSoup(respon.content, "html.parser") print(soup.prettify())
note : alamat url dapat agan ganti yang lainyasehabis agan membuatnya menyerupai di atas silahkan coba jalankan dan akibatnya akan menyerupai di bawah ini
<a href="https://xomlic.blogspot.com" rel="nofollow"> </a> </span> <span> berguru bs4 </span> </div> <div class="blog-posts hfeed"> <!--Can't find substitution for tag [defaultAdStart]--> <div class="date-outer"> <div class="date-posts"> <div class="post-outer"> <article class="post hentry"> <h1 class="post-title entry-title"> berguru bs4 </h1> <div class="post-info"> <span class="item-control blog-admin pid-2102565653"> <a href="https://www.blogger.com/page-edit.g?blogID=2743239978184035798&pageID=5128740299106525223&from=pencil" title="Parsing Data Dengan Python"> <img alt=" Kali ini aku akan membagikan tutorial parsing data atau Parsing Data Dengan Python" class="icon-action" height="18" src="https://img2.blogblog.com/img/icon18_edit_allbkg.gif" width="18"/> </a> </span> </div> <div class="post-header"> <div class="post-header-line-1"> </div> </div> <div class="post-body entry-content" id="post-body-5128740299106525223"> ini ialah halaman pembelajaran scraping data dengan bs4 <br/> <br/> kunjungi terus blog ini, sebab disini banyak tutorial tutorial menarik untuk termux <br/> <br/> kunjungi juga channel youtube di sana daerah aku mengupload video video tutorial untuk termux <div class="clear"> </div> </div>
ini hanyalah potonganya sajaok selanjutnya
kita akan mencoba mencari beberapa kepingan dari blog di atas seperti
• title
• deskripsi blog
• link dll
untuk lebih jelasnya silahkan lihat kegiatan di bawah ini
import requests from bs4 import BeautifulSoup url = 'https://xomlic.blogspot.comp/belajar-bs4.html?m=1' with requests.Session() as c: respon = c.get(url) soup = BeautifulSoup(respon.content, "html.parser") print("1", soup.title) print("2", soup.title.name) print("3", soup.title.parent.name) print("4", soup.p) print("5", soup.p['class']) print("6", soup.a)
silahkan save dan jalankan maka akibatnya akan menyerupai di bawah ini1 <title>belajar bs4 - Jejaka Tutorial</title> 2 title 3 head 4 <p class="description"><span>Blog ini ihwal tutorial seputar termux, dunia hacking, pemrograman, dll </span></p> 5 ['description'] 6 <a href="https://xomlic.blogspot.com">Home</a>
dengan module bs4 ini kita dapat mencari link link yang tersimpan di dalam blog
caranya :
import requests from bs4 import BeautifulSoup url = 'https://xomlic.blogspot.comp/belajar-bs4.html?m=1' with requests.Session() as c: respon = c.get(url) soup = BeautifulSoup(respon.content, "html.parser") for link in soup.find_all('a'): print (link.get('href'))
saat agan menjalankan nya maka outputnya akan mengeluar kan banyak link yang terkandung dalam blog ini menyerupai di bawah inihttps://xomlic.blogspot.com https://xomlic.blogspot.comp/about.html https://xomlic.blogspot.comp/name-email-address-important-content.html https://xomlic.blogspot.comp/div-idbptocloading-toc.html https://m.youtube.com/channel/UCn5d8Xbp0yt-SWTmxwtayvQ https://xomlic.blogspot.com https://xomlic.blogspot.comp/termux.html https://xomlic.blogspot.comp/mining.html https://xomlic.blogspot.comp/nuyul.html https://xomlic.blogspot.comp/hack.html?m=1 https://xomlic.blogspot.com https://www.blogger.com/page-edit.g?blogID=2743239978184035798&pageID=5128740299106525223&from=pencil https://www.blogger.com/comment-iframe.g?blogID=2743239978184035798&pageID=5128740299106525223 https://xomlic.blogspot.comfeeds/posts/default http://facebook.com/Jejaka-Tutorial-2230728320541897 http://plus.google.com/106273771548209106947 https://youtube.com/channel/UCn5d8Xbp0yt-SWTmxwtayvQ http://instagram.com/lutfi_ainun_32
selanjutnya kita akan mencari blog post atau postingan aku dari url di blog ini
Sebelum itu Agan Harus Tau Id dari kepingan yang akan agan ambil
untuk mengetahui nya caranya
pertama silahkan masukk ke browser anda
pastekan di url browser view-source:https://xomlic.blogspot.comp/belajar-bs4.html?m=1
kemudian cari id yang akan agan ambil, sebagai teladan agan dapat lihat gambar di bawah ini
ok selanjutnya silahkan simak potongan kegiatan di bawah ini
import requests from bs4 import BeautifulSoup url = 'https://xomlic.blogspot.comp/belajar-bs4.html?m=1' with requests.Session() as c: respon = c.get(url) soup = BeautifulSoup(respon.content, "html.parser") print(soup.find(id='post-body-5128740299106525223').text)
silahkan save dan jalankan
outputnya kurang lebih menyerupai di bawah ini
ini ialah halaman pembelajaran scraping data dengan bs4 kunjungi terus blog ini, sebab disini banyak tutorial tutorial menarik untuk termux kunjungi juga channel youtube di sana daerah aku mengupload video video tutorial untuk termux
Hasil nya sama dengan postingan aku yang ada di blog saya
sumber :
sekian dari aku terima kasih
Sumber https://jejakatutorial-termux.blogspot.com/
Share this Article