close

大部分sql資料庫都會有自帶的保護措施

防範駭客的攻擊

因此會限制一些特定符號的存入

像是html的原始碼的內容就無法存入資料庫

這時候就可以使用以下的語法進行轉譯:

 

import html
a = '<a href="//home.gamer.com.tw/jack87108" class="username" target="_blank">你好</a>'
html.escape(a)

out: '&lt;a href=&quot;//home.gamer.com.tw/jack87108&quot; class=&quot;username&quot; target=&quot;_blank&quot;&gt;你好&lt;/a&gt;'

 

以下則是反轉譯:

 

html.unescape(a)
<a class="username" href="//home.gamer.com.tw/jack87108" target="_blank">你好</a> 
 

而如果使用bs4爬蟲取得的html原始碼,則需要進行轉型

這邊先舉失敗的案例:

134.JPG

由於爬蟲下來的內容沒有定義變量的類型,導致escape運行時發生了錯誤

因此我將他轉成str類型,即可正常地進行轉譯了:

135.JPG

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 ivankao 的頭像
    ivankao

    IvanKao的部落格

    ivankao 發表在 痞客邦 留言(0) 人氣()