what to do
play

What to do When Google ignores your Fedora objects Robin - PowerPoint PPT Presentation

What to do When Google ignores your Fedora objects Robin Dean Jonathan Green robin@coalliance.org jonathan@discoverygarden.ca Digital Repository Director Chief Technology Officer


  1. What ¡to ¡do ¡ When ¡Google ¡ignores ¡your ¡Fedora ¡objects Robin ¡Dean Jonathan ¡Green robin@coalliance.org jonathan@discoverygarden.ca Digital ¡Repository ¡Director Chief ¡Technology ¡Officer Colorado ¡Alliance ¡of ¡Research ¡Libraries discoverygarden ¡inc. Open ¡Repositories ¡2013 CharloGetown, ¡Prince ¡Edward ¡Island, ¡Canada Fedora ¡Users ¡Group ¡– ¡Thursday ¡July ¡11, ¡5:30 ¡PM 1

  2. Alliance ¡ Digital ¡ Repository Fedora ¡3.4.2 Islandora ¡11.3 ¡ ¡ + ¡Drupal ¡6 ¡ ¡ + ¡Core ¡Islandora ¡Modules ¡ + ¡Custom ¡Modules/Viewer hGp://adr.coalliance.org 2

  3. Custom ¡Compound ¡Object ¡Viewer ¡in ¡Islandora ¡6 3

  4. 1. ¡Create ¡RSS ¡sitemaps ¡of ¡Fedora ¡ objects ¡for ¡search ¡engines Improving ¡ 2. ¡Improve ¡search ¡results ¡ repository ¡ snippets ¡by ¡re-­‑using ¡MODS ¡ search ¡results ¡ metadata ¡in ¡HTML ¡<meta> ¡tags in ¡Google 3. ¡Add ¡meaning ¡for ¡search ¡ engines ¡“behind ¡the ¡scenes” ¡with ¡ RDFa 4

  5. Without ¡Sitemaps ¡(Bing) With ¡Sitemaps ¡(Google) 5

  6. 1. ¡ ¡ Index ¡all ¡Fedora ¡objects ¡in ¡ Solr How ¡did ¡we ¡ make ¡RSS ¡ 2. ¡ ¡ Add ¡public ¡objects ¡in ¡Solr ¡to ¡ an ¡RSS ¡feed ¡using ¡Islandora sitemaps ¡in ¡ 3. ¡ ¡ Submit ¡the ¡RSS ¡feed ¡as ¡a ¡ Islandora? sitemap ¡in ¡Google ¡ Webmaster ¡Tools ¡ 6

  7. Sitemap ¡Details ¡from ¡Google ¡Webmaster ¡Tools 7

  8. Trend ¡in ¡Pages ¡Crawled ¡and ¡Pages ¡Indexed Pages ¡ Crawled Pages ¡ Indexed RSS ¡sitemap ¡ Page ¡ Pages ¡ Page ¡error ¡ submiGed ¡ error ¡ indexed ¡ fixed ¡for ¡ October ¡23, ¡ fixed ¡in ¡ starts ¡to ¡ ETDs 2012 Islandora decrease ¡(?) 8

  9. 1. Google ¡scholar ¡is ¡trickier. ¡ Uses ¡a ¡different ¡web ¡crawler ¡ than ¡normal ¡Google. What ¡about ¡ Google ¡ 2. ¡Doesn’t ¡accept ¡RSS ¡sitemaps. Scholar? 3. ¡In ¡a ¡large ¡repository, ¡indexer ¡ tends ¡to ¡request ¡a ¡lot ¡of ¡ documents ¡very ¡quickly. 9

  10. 1. Create ¡simple ¡HTML ¡pages. Google ¡Scholar 2. ¡ ¡ Create ¡a ¡list ¡of ¡recently ¡added ¡ papers. Sitemaps 3. ¡ ¡ Ensure ¡that ¡Google ¡can ¡ quickly ¡crawl ¡your ¡pages. ¡ 10

  11. Re-­‑use ¡descripjve ¡metadata ¡in ¡HTML ¡<meta> ¡descripjon ¡ Islandora ¡Solr ¡Results Google ¡Search ¡Results 11

  12. 1. ¡ ¡ Scholar ¡expects ¡meta ¡tags ¡in ¡ its ¡own ¡format. 2. Google ¡Scholar ¡supports Google ¡Scholar -­‑ Highwire ¡Press ¡tags Meta ¡Tags -­‑ Eprints ¡tags -­‑ PRISM ¡tags. ¡ 3. ¡Limited ¡support ¡for ¡Dublin ¡ Core ¡tags. 12

  13. Google ¡Scholar ¡<meta> ¡Tag ¡Examples <meta ¡name="citajon_jtle" ¡content="12-­‑Acetoxypseudopterolide" ¡ /> <meta ¡name="citajon_author" ¡content="Ata, ¡A." ¡ /> <meta ¡name="citajon_author" ¡content="Kerr, ¡R. ¡G." ¡ /> <meta ¡name="citajon_author" ¡content=", ¡." ¡ /> <meta ¡name="citajon_publicajon_date" ¡content="2000" ¡ /> <meta ¡name="citajon_journal_jtle" ¡content="" ¡ /> <meta ¡name="citajon_volume" ¡content="53" ¡ /> <meta ¡name="citajon_issue" ¡content="3" ¡ /> <meta ¡name="citajon_firstpage" ¡content="717" ¡ /> 13

  14. Rich ¡results ¡with ¡schema.org ¡microdata hGp://schema.org/Recipe hGp://schema.org/Review 14

  15. Before ¡RDFa Aper ¡RDFa 15

  16. Use ¡an ¡object ¡type ¡that ¡exists ¡in ¡ an ¡ontology ¡we ¡can ¡link ¡to RDFa ¡ Try ¡the ¡MODS ¡RDF ¡elements ¡ fixes ¡and ¡ instead ¡of ¡our ¡homegrown ¡ MODS ¡crosswalk improvements Empty ¡elements ¡should ¡not ¡be ¡ marked ¡up ¡with ¡RDFa 16

  17. Improve ¡crawling Next ¡Steps ¡for ¡ Look ¡to ¡others ¡in ¡the ¡community ¡ Google ¡Scholar ¡ for ¡advice Indexing Create ¡caches ¡that ¡Google ¡ Scholar ¡can ¡crawl ¡faster 17

  18. Robin ¡Dean robin@coalliance.org Quesjons ¡ Digital ¡Repository ¡Director Colorado ¡Alliance ¡of ¡Research ¡Libraries and Discussion Jonathan ¡Green jonathan@discoverygarden.ca Chief ¡Technology ¡Officer discoverygarden ¡inc. 18

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend