維基百科討論:數據庫下載
希望開放網站的原始碼
轉向的下載頁面都是英文的,在這個頁面上應該寫的詳細點。大家提點建議,因為想要下載的人不少。—Liu.peng.666 2007年7月8日 (日) 19:19 (UTC)
- 加了一些內容上去。Gslin 2007年7月9日 (一) 03:34 (UTC)
我是新加入的,下載了幾個中文壓縮包,其中一個是20080407的,645M的那個,擴展名是7z,打開壓縮包後是56G,擴展名是xml的,用什麼軟件都看不了,裏面全是亂碼。我看不懂英文,請問可以下載的這些壓縮包都是什麼內容,有什麼區別。下載後如何觀看和閱讀?裏面有帶圖片的嗎?
請求名詞解釋
[編輯]什麼叫「下載軟體」?希望使用通用漢語給予解釋或更換措辭,謝謝!Li Chao (留言) 2008年9月15日 (一) 09:21 (UTC)
xml文件可以通過mwdumper導入到一個架設好的MediaWiki站點的數據庫中,或者通過WikiFilter(兼容性未經測試)以及Wikitaxi進行瀏覽。
下載軟體就是下載工具軟件,比如迅雷、快車以及古老的網絡螞蟻等等。
跨語言提刪通告
[編輯]本頁面的其他語言版本(ja:Wikipedia:データベースダウンロード)正在進行存廢討論。您可以到該語言版本的刪除討論頁面發表您的意見,或者根據該語言版本的刪除討論意見以及中文版該頁面的狀況提交存廢討論或進行改善。--Sz-iwbot (留言) 2010年4月26日 (一) 15:46 (UTC)
試圖建立維基百科鏡像站點遭遇的問題
[編輯]各位好:
我試圖通過下載維基百科數據庫,並建立一個鏡像站,在下載備份文件並成功通過importDump.php導入後,在前台顯示的部分頁面發生錯亂,為此,我希望能夠得到各位的援助,謝謝!
目前我面臨的問題主要是以下幾個:
1、在輸入wiki.xxx.com後,會自動跳轉到en.wikipedia.com去,如果直接打開wiki.xxx.com/index.php/首頁,則能正常打開,但是在左側導航欄中的「首頁」按鈕也是指向en.wikipedia.com
2、部分頁面顯示效果差異,如下圖1和圖2
http://bayimg.com/daamcAaDB http://bayimg.com/DAAMeaaDb
3、通過Firefox正常,通過Chrome打開條目錯亂,如我打開的是A條目,顯示的是B條目給我
我的聯繫方式: Email:[email protected] QQ:4423567
115.238.34.206 (留言) 2010年10月25日 (一) 12:48 (UTC)
下載地址已經無效了
--116.5.37.61(留言) 2012年7月23日 (一) 15:40 (UTC)
新人,不知道用什麼打開維基數據庫,請教?
[編輯]如題,試了wikitaxi,然後整個C盤壞掉了啊,不敢再試了,有誰知道什麼一定可以的嗎?
無不詳(留言) 2015年11月1日 (日) 09:10 (UTC)
在數據庫下載頁面裏有很多文件,我怎麼知道哪些是我需要的?
[編輯]比如我想下載完整版的wiki離線使用,當然帶圖片的最好,下面這麼多文件,我需要下載哪些呢?
Index of /zhwiki/latest/
../
zhwiki-latest-abstract-zh-cn1.xml
zhwiki-latest-abstract-zh-cn1.xml-rss.xml
zhwiki-latest-abstract-zh-cn2.xml
zhwiki-latest-abstract-zh-cn2.xml-rss.xml
zhwiki-latest-abstract-zh-cn3.xml
zhwiki-latest-abstract-zh-cn3.xml-rss.xml
zhwiki-latest-abstract-zh-cn4.xml
zhwiki-latest-abstract-zh-cn4.xml-rss.xml
zhwiki-latest-abstract-zh-tw1.xml
zhwiki-latest-abstract-zh-tw1.xml-rss.xml
zhwiki-latest-abstract-zh-tw2.xml
zhwiki-latest-abstract-zh-tw2.xml-rss.xml
zhwiki-latest-abstract-zh-tw3.xml
zhwiki-latest-abstract-zh-tw3.xml-rss.xml
zhwiki-latest-abstract-zh-tw4.xml
zhwiki-latest-abstract-zh-tw4.xml-rss.xml
zhwiki-latest-abstract.xml
zhwiki-latest-abstract.xml-rss.xml
zhwiki-latest-abstract1.xml
zhwiki-latest-abstract1.xml-rss.xml
zhwiki-latest-abstract2.xml
zhwiki-latest-abstract2.xml-rss.xml
zhwiki-latest-abstract3.xml
zhwiki-latest-abstract3.xml-rss.xml
zhwiki-latest-abstract4.xml
zhwiki-latest-abstract4.xml-rss.xml
zhwiki-latest-all-titles-in-ns0.gz
zhwiki-latest-all-titles-in-ns0.gz-rss.xml
zhwiki-latest-all-titles.gz
zhwiki-latest-all-titles.gz-rss.xml
zhwiki-latest-category.sql.gz
zhwiki-latest-category.sql.gz-rss.xml
zhwiki-latest-categorylinks.sql.gz
zhwiki-latest-categorylinks.sql.gz-rss.xml
zhwiki-latest-change_tag.sql.gz
zhwiki-latest-change_tag.sql.gz-rss.xml
zhwiki-latest-externallinks.sql.gz
zhwiki-latest-externallinks.sql.gz-rss.xml
zhwiki-latest-flow.xml.bz2
zhwiki-latest-flow.xml.bz2-rss.xml
zhwiki-latest-flowhistory.xml.bz2
zhwiki-latest-flowhistory.xml.bz2-rss.xml
zhwiki-latest-geo_tags.sql.gz
zhwiki-latest-geo_tags.sql.gz-rss.xml
zhwiki-latest-image.sql.gz
zhwiki-latest-image.sql.gz-rss.xml
zhwiki-latest-imagelinks.sql.gz
zhwiki-latest-imagelinks.sql.gz-rss.xml
zhwiki-latest-iwlinks.sql.gz
zhwiki-latest-iwlinks.sql.gz-rss.xml
zhwiki-latest-langlinks.sql.gz
zhwiki-latest-langlinks.sql.gz-rss.xml
zhwiki-latest-md5sums.txt
zhwiki-latest-page.sql.gz
zhwiki-latest-page.sql.gz-rss.xml
zhwiki-latest-page_props.sql.gz
zhwiki-latest-page_props.sql.gz-rss.xml
zhwiki-latest-page_restrictions.sql.gz
zhwiki-latest-page_restrictions.sql.gz-rss.xml
zhwiki-latest-pagelinks.sql.gz
zhwiki-latest-pagelinks.sql.gz-rss.xml
zhwiki-latest-pages-articles.xml.bz2
zhwiki-latest-pages-articles.xml.bz2-rss.xml
zhwiki-latest-pages-articles1.xml.bz2
zhwiki-latest-pages-articles1.xml.bz2-rss.xml
zhwiki-latest-pages-articles2.xml.bz2
zhwiki-latest-pages-articles2.xml.bz2-rss.xml
zhwiki-latest-pages-articles3.xml.bz2
zhwiki-latest-pages-articles3.xml.bz2-rss.xml
zhwiki-latest-pages-articles4.xml.bz2
zhwiki-latest-pages-articles4.xml.bz2-rss.xml
zhwiki-latest-pages-logging.xml.gz
zhwiki-latest-pages-logging.xml.gz-rss.xml
zhwiki-latest-pages-meta-current.xml.bz2
zhwiki-latest-pages-meta-current.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current1.xml.bz2
zhwiki-latest-pages-meta-current1.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current2.xml.bz2
zhwiki-latest-pages-meta-current2.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current3.xml.bz2
zhwiki-latest-pages-meta-current3.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current4.xml.bz2
zhwiki-latest-pages-meta-current4.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history1.xml.7z
zhwiki-latest-pages-meta-history1.xml.7z-rss.xml
zhwiki-latest-pages-meta-history1.xml.bz2
zhwiki-latest-pages-meta-history1.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history2.xml.7z
zhwiki-latest-pages-meta-history2.xml.7z-rss.xml
zhwiki-latest-pages-meta-history2.xml.bz2
zhwiki-latest-pages-meta-history2.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history3.xml.7z
zhwiki-latest-pages-meta-history3.xml.7z-rss.xml
zhwiki-latest-pages-meta-history3.xml.bz2
zhwiki-latest-pages-meta-history3.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history4.xml.7z
zhwiki-latest-pages-meta-history4.xml.7z-rss.xml
zhwiki-latest-pages-meta-history4.xml.bz2
zhwiki-latest-pages-meta-history4.xml.bz2-rss.xml
zhwiki-latest-protected_titles.sql.gz
zhwiki-latest-protected_titles.sql.gz-rss.xml
zhwiki-latest-redirect.sql.gz
zhwiki-latest-redirect.sql.gz-rss.xml
zhwiki-latest-sha1sums.txt
zhwiki-latest-site_stats.sql.gz
zhwiki-latest-site_stats.sql.gz-rss.xml
zhwiki-latest-siteinfo-namespaces.json
zhwiki-latest-siteinfo-namespaces.json-rss.xml
zhwiki-latest-sites.sql.gz
zhwiki-latest-sites.sql.gz-rss.xml
zhwiki-latest-stub-articles.xml.gz
zhwiki-latest-stub-articles.xml.gz-rss.xml
zhwiki-latest-stub-articles1.xml.gz
zhwiki-latest-stub-articles1.xml.gz-rss.xml
zhwiki-latest-stub-articles2.xml.gz
zhwiki-latest-stub-articles2.xml.gz-rss.xml
zhwiki-latest-stub-articles3.xml.gz
zhwiki-latest-stub-articles3.xml.gz-rss.xml
zhwiki-latest-stub-articles4.xml.gz
zhwiki-latest-stub-articles4.xml.gz-rss.xml
zhwiki-latest-stub-meta-current.xml.gz
zhwiki-latest-stub-meta-current.xml.gz-rss.xml
zhwiki-latest-stub-meta-current1.xml.gz
zhwiki-latest-stub-meta-current1.xml.gz-rss.xml
zhwiki-latest-stub-meta-current2.xml.gz
zhwiki-latest-stub-meta-current2.xml.gz-rss.xml
zhwiki-latest-stub-meta-current3.xml.gz
zhwiki-latest-stub-meta-current3.xml.gz-rss.xml
zhwiki-latest-stub-meta-current4.xml.gz
zhwiki-latest-stub-meta-current4.xml.gz-rss.xml
zhwiki-latest-stub-meta-history.xml.gz
zhwiki-latest-stub-meta-history.xml.gz-rss.xml
zhwiki-latest-stub-meta-history1.xml.gz
zhwiki-latest-stub-meta-history1.xml.gz-rss.xml
zhwiki-latest-stub-meta-history2.xml.gz
zhwiki-latest-stub-meta-history2.xml.gz-rss.xml
zhwiki-latest-stub-meta-history3.xml.gz
zhwiki-latest-stub-meta-history3.xml.gz-rss.xml
zhwiki-latest-stub-meta-history4.xml.gz
zhwiki-latest-stub-meta-history4.xml.gz-rss.xml
zhwiki-latest-templatelinks.sql.gz
zhwiki-latest-templatelinks.sql.gz-rss.xml
zhwiki-latest-user_groups.sql.gz
zhwiki-latest-user_groups.sql.gz-rss.xml
zhwiki-latest-wbc_entity_usage.sql.gz
zhwiki-latest-wbc_entity_usage.sql.gz-rss.xml
—以上未簽名的留言由維基小王子(對話|貢獻)於2017年9月7日 (四) 02:25 (UTC)加入。
維基百科導出
[編輯]
維基百科數據庫的導出/下載能否統一成一種變體或者增加變體選項,比如zh-cn的數據就是純簡體且文章內文使用zh-cn的地區詞。目前下載的內容應該是繁簡體和地區詞混用,條目中一個名詞使用多個不同的稱呼。--Kethyga(留言) 2024年11月15日 (五) 11:07 (UTC)
- 字詞轉換是mediawiki的功能,數據庫是數據庫,導出後一般也是在其它使用mediawiki或類mw的站點使用,感覺不該在數據庫層面上轉換。未登錄用戶的頁面是按變體分別生成的緩存,但不知道在哪裏獲取。——暁月凜奈 (留言) 2024年11月15日 (五) 11:17 (UTC)
- 從裏面找了一段
<sublink linktype="nav"><anchor>符号、语言与精确性</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#符號、語言與精确性</link></sublink> <sublink linktype="nav"><anchor>数学作为科学</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#數學作為科學</link></sublink> <sublink linktype="nav"><anchor>数学的各领域</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#數學的各領域</link></sublink> <sublink linktype="nav"><anchor>基础与哲学</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#基礎與哲學</link></sublink>
- 原始碼和渲染後的都有,不清楚「目前下載的內容應該是繁簡體和地區詞混用」具體是什麼情況。——暁月凜奈 (留言) 2024年11月15日 (五) 11:22 (UTC)
- 比如這篇、wikipedia-to-zh-cn、[Wikiwand 泰勒·斯威夫特](Taylor Swift)、IPFS版(使用的Kiwix),如果導出的內容不是在維基系統中使用,就是繁簡體和地區詞混用。--Kethyga(留言) 2024年11月15日 (五) 12:41 (UTC)
- IPFS那個應該是抓網頁的(可能是移動版或者新Vector),另外提供那個是拿數據庫生數據再用自己的轉換庫去改的(沒有套用mw的轉換)。這些原始數據需要自行處理。數據庫dump就真是數據庫dump罷了。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年11月16日 (六) 03:22 (UTC)
- 繁簡混用的話,轉換還比較簡單,地區用詞混用的話,在維基系統之外使用就比較受限,特別是同一頁面中用不同名稱稱呼一個概念。--Kethyga(留言) 2024年11月16日 (六) 04:49 (UTC)
- 具體指怎樣的導出方式?技術上不支持,數據庫存儲的原始碼就是簡繁混合的,字詞轉換涉及MediaWiki程序及轉換表、模塊/模版。如果要抓轉換後結果,只能抓網頁/API。--YFdyh000(留言) 2024年11月15日 (五) 11:56 (UTC)
- 技術上存入數據庫的wikicode都是繁簡混合併且未套用各種轉換機制(四層轉換表)的,只有經過mw解析器的套用後才有各種變體的顯示效果。所以要麼用網頁抓取,要麼自己拆解解析器的代碼來改。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年11月16日 (六) 03:15 (UTC)