Come leggere il dannato articolo protetto da un paywall.
add-on per browser
https://github.com/magnolia1234/bypass-paywalls-firefox-clean/blob/master/README.md
https://github.com/iamadamdev/bypass-paywalls-firefox
https://github.com/iamadamdev/bypass-paywalls-chrome
un articolo con cui fare la prova..
uno script in python
Mi spiace ma non ricordo chi me l'ha passato. Comunque grazie!
incollare in ~/bin/saltafosso.py, chmod 755 saltafosso.py
uso: saltafosso.py [link articolo]
(da questa riga esclusa in poi)
#!/usr/bin/env python
import lxml.html
import urllib2
import re
import sys
def get_rep_text(url):
text_url = re.sub(r'/pwa/', '/ws/detail/', url)
page = urllib2.urlopen(text_url).read()
root = lxml.html.fromstring(page)
for div in root.xpath('//div[@class="paywall"]'):
print div.text_content()
if __name__ == '__main__':
get_rep_text(sys.argv[1])