I’d like to retrieve the image source within the below HTML code block, but can’t find the right syntax.
library(XML)
library(RCurl)
script <- getURL("http://www.floraweb.de/pflanzenarten/druck.xsql?suchnr=4346")
(doc <- htmlParse(script))
<div class="divider"><hr></div>
<div id="contentblock"><div id="content">
<h1>Alle Angaben</h1>
<p>Zu der von Ihnen gewählten Pflanzenart liegen folgende Informationen vor:</p>
<p><a href="../glossar.html#bname">Wissenschaftlicher Name</a>:Â Poa badensis agg. </p>
<p><a href="../glossar.html#bdeu">Deutscher Name</a>:Â Artengruppe Badener Rispengras</p>
<p><a href="../glossar.html#bfam">Familienzugehörigkeit</a>: Poaceae, Süßgräser</p>
<p><a href="../glossar.html#bsta">Status</a>: keine Angaben </p>
<p class="centeredcontent"><img border="0" src="../bilder/Arten/dummy.tmb.jpg"></p>
Desired result:
“../bilder/Arten/dummy.tmb.jpg”
Any pointers are greatly appreciated!
Try the following:
The use of Internal representation maybe necessary
EDIT:
I just looked up
htmlParseand its equivalent tohtmlTreeParse(useInternalNodes=T)@Martin Morgan thanks have added below