跳转到内容

英文维基 | 中文维基 | 日文维基 | 草榴社区

维基百科讨论:数据库下载

页面内容不支持其他语言。
维基百科,自由的百科全书

希望开放网站的源代码

转向的下载页面都是英文的,在这个页面上应该写的详细点。大家提点建议,因为想要下载的人不少。—Liu.peng.666 2007年7月8日 (日) 19:19 (UTC)[回复]

加了一些內容上去。Gslin 2007年7月9日 (一) 03:34 (UTC)[回复]

我是新加入的,下载了几个中文压缩包,其中一个是20080407的,645M的那个,扩展名是7z,打开压缩包后是56G,扩展名是xml的,用什么软件都看不了,里面全是乱码。我看不懂英文,请问可以下载的这些压缩包都是什么内容,有什么区别。下载后如何观看和阅读?里面有带图片的吗?

请求名词解释

[编辑]

什么叫“下载软体”?希望使用通用汉语给予解释或更换措辞,谢谢!Li Chao (留言) 2008年9月15日 (一) 09:21 (UTC)[回复]

xml文件可以通过mwdumper导入到一个架设好的MediaWiki站点的数据库中,或者通过WikiFilter(兼容性未经测试)以及Wikitaxi进行浏览。

下载软体就是下载工具软件,比如迅雷、快车以及古老的网络蚂蚁等等。

跨语言提删通告

[编辑]

本页面的其他语言版本(ja:Wikipedia:データベースダウンロード)正在进行存废讨论。您可以到该语言版本的删除讨论页面发表您的意见,或者根据该语言版本的删除讨论意见以及中文版该页面的状况提交存废讨论或进行改善。--Sz-iwbot (留言) 2010年4月26日 (一) 15:46 (UTC)[回复]

试图建立维基百科镜像站点遭遇的问题

[编辑]

各位好:

我试图通过下载维基百科数据库,并建立一个镜像站,在下载备份文件并成功通过importDump.php导入后,在前台显示的部分页面发生错乱,为此,我希望能够得到各位的援助,谢谢!

目前我面临的问题主要是以下几个:

1、在输入wiki.xxx.com后,会自动跳转到en.wikipedia.com去,如果直接打开wiki.xxx.com/index.php/首页,则能正常打开,但是在左侧导航栏中的“首页”按钮也是指向en.wikipedia.com

2、部分页面显示效果差异,如下图1和图2

http://bayimg.com/daamcAaDB http://bayimg.com/DAAMeaaDb

3、通过Firefox正常,通过Chrome打开条目错乱,如我打开的是A条目,显示的是B条目给我

http://bayimg.com/DAAmLaaDB

我的联系方式: Email:[email protected] QQ:4423567

115.238.34.206 (留言) 2010年10月25日 (一) 12:48 (UTC)[回复]


下载地址已经无效了

--116.5.37.61留言2012年7月23日 (一) 15:40 (UTC)[回复]

新人,不知道用什么打开维基数据库,请教?

[编辑]

如题,试了wikitaxi,然后整个C盘坏掉了啊,不敢再试了,有谁知道什么一定可以的吗?

无不详留言2015年11月1日 (日) 09:10 (UTC)[回复]

在数据库下载页面里有很多文件,我怎么知道哪些是我需要的?

[编辑]

比如我想下载完整版的wiki离线使用,当然带图片的最好,下面这么多文件,我需要下载哪些呢?



Index of /zhwiki/latest/
../
zhwiki-latest-abstract-zh-cn1.xml
zhwiki-latest-abstract-zh-cn1.xml-rss.xml
zhwiki-latest-abstract-zh-cn2.xml
zhwiki-latest-abstract-zh-cn2.xml-rss.xml
zhwiki-latest-abstract-zh-cn3.xml
zhwiki-latest-abstract-zh-cn3.xml-rss.xml
zhwiki-latest-abstract-zh-cn4.xml
zhwiki-latest-abstract-zh-cn4.xml-rss.xml
zhwiki-latest-abstract-zh-tw1.xml
zhwiki-latest-abstract-zh-tw1.xml-rss.xml
zhwiki-latest-abstract-zh-tw2.xml
zhwiki-latest-abstract-zh-tw2.xml-rss.xml
zhwiki-latest-abstract-zh-tw3.xml
zhwiki-latest-abstract-zh-tw3.xml-rss.xml
zhwiki-latest-abstract-zh-tw4.xml
zhwiki-latest-abstract-zh-tw4.xml-rss.xml
zhwiki-latest-abstract.xml
zhwiki-latest-abstract.xml-rss.xml
zhwiki-latest-abstract1.xml
zhwiki-latest-abstract1.xml-rss.xml
zhwiki-latest-abstract2.xml
zhwiki-latest-abstract2.xml-rss.xml
zhwiki-latest-abstract3.xml
zhwiki-latest-abstract3.xml-rss.xml
zhwiki-latest-abstract4.xml
zhwiki-latest-abstract4.xml-rss.xml
zhwiki-latest-all-titles-in-ns0.gz
zhwiki-latest-all-titles-in-ns0.gz-rss.xml
zhwiki-latest-all-titles.gz
zhwiki-latest-all-titles.gz-rss.xml
zhwiki-latest-category.sql.gz
zhwiki-latest-category.sql.gz-rss.xml
zhwiki-latest-categorylinks.sql.gz
zhwiki-latest-categorylinks.sql.gz-rss.xml
zhwiki-latest-change_tag.sql.gz
zhwiki-latest-change_tag.sql.gz-rss.xml
zhwiki-latest-externallinks.sql.gz
zhwiki-latest-externallinks.sql.gz-rss.xml
zhwiki-latest-flow.xml.bz2
zhwiki-latest-flow.xml.bz2-rss.xml
zhwiki-latest-flowhistory.xml.bz2
zhwiki-latest-flowhistory.xml.bz2-rss.xml
zhwiki-latest-geo_tags.sql.gz
zhwiki-latest-geo_tags.sql.gz-rss.xml
zhwiki-latest-image.sql.gz
zhwiki-latest-image.sql.gz-rss.xml
zhwiki-latest-imagelinks.sql.gz
zhwiki-latest-imagelinks.sql.gz-rss.xml
zhwiki-latest-iwlinks.sql.gz
zhwiki-latest-iwlinks.sql.gz-rss.xml
zhwiki-latest-langlinks.sql.gz
zhwiki-latest-langlinks.sql.gz-rss.xml
zhwiki-latest-md5sums.txt
zhwiki-latest-page.sql.gz
zhwiki-latest-page.sql.gz-rss.xml
zhwiki-latest-page_props.sql.gz
zhwiki-latest-page_props.sql.gz-rss.xml
zhwiki-latest-page_restrictions.sql.gz
zhwiki-latest-page_restrictions.sql.gz-rss.xml
zhwiki-latest-pagelinks.sql.gz
zhwiki-latest-pagelinks.sql.gz-rss.xml
zhwiki-latest-pages-articles.xml.bz2
zhwiki-latest-pages-articles.xml.bz2-rss.xml
zhwiki-latest-pages-articles1.xml.bz2
zhwiki-latest-pages-articles1.xml.bz2-rss.xml
zhwiki-latest-pages-articles2.xml.bz2
zhwiki-latest-pages-articles2.xml.bz2-rss.xml
zhwiki-latest-pages-articles3.xml.bz2
zhwiki-latest-pages-articles3.xml.bz2-rss.xml
zhwiki-latest-pages-articles4.xml.bz2
zhwiki-latest-pages-articles4.xml.bz2-rss.xml
zhwiki-latest-pages-logging.xml.gz
zhwiki-latest-pages-logging.xml.gz-rss.xml
zhwiki-latest-pages-meta-current.xml.bz2
zhwiki-latest-pages-meta-current.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current1.xml.bz2
zhwiki-latest-pages-meta-current1.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current2.xml.bz2
zhwiki-latest-pages-meta-current2.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current3.xml.bz2
zhwiki-latest-pages-meta-current3.xml.bz2-rss.xml
zhwiki-latest-pages-meta-current4.xml.bz2
zhwiki-latest-pages-meta-current4.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history1.xml.7z
zhwiki-latest-pages-meta-history1.xml.7z-rss.xml
zhwiki-latest-pages-meta-history1.xml.bz2
zhwiki-latest-pages-meta-history1.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history2.xml.7z
zhwiki-latest-pages-meta-history2.xml.7z-rss.xml
zhwiki-latest-pages-meta-history2.xml.bz2
zhwiki-latest-pages-meta-history2.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history3.xml.7z
zhwiki-latest-pages-meta-history3.xml.7z-rss.xml
zhwiki-latest-pages-meta-history3.xml.bz2
zhwiki-latest-pages-meta-history3.xml.bz2-rss.xml
zhwiki-latest-pages-meta-history4.xml.7z
zhwiki-latest-pages-meta-history4.xml.7z-rss.xml
zhwiki-latest-pages-meta-history4.xml.bz2
zhwiki-latest-pages-meta-history4.xml.bz2-rss.xml
zhwiki-latest-protected_titles.sql.gz
zhwiki-latest-protected_titles.sql.gz-rss.xml
zhwiki-latest-redirect.sql.gz
zhwiki-latest-redirect.sql.gz-rss.xml
zhwiki-latest-sha1sums.txt
zhwiki-latest-site_stats.sql.gz
zhwiki-latest-site_stats.sql.gz-rss.xml
zhwiki-latest-siteinfo-namespaces.json
zhwiki-latest-siteinfo-namespaces.json-rss.xml
zhwiki-latest-sites.sql.gz
zhwiki-latest-sites.sql.gz-rss.xml
zhwiki-latest-stub-articles.xml.gz
zhwiki-latest-stub-articles.xml.gz-rss.xml
zhwiki-latest-stub-articles1.xml.gz
zhwiki-latest-stub-articles1.xml.gz-rss.xml
zhwiki-latest-stub-articles2.xml.gz
zhwiki-latest-stub-articles2.xml.gz-rss.xml
zhwiki-latest-stub-articles3.xml.gz
zhwiki-latest-stub-articles3.xml.gz-rss.xml
zhwiki-latest-stub-articles4.xml.gz
zhwiki-latest-stub-articles4.xml.gz-rss.xml
zhwiki-latest-stub-meta-current.xml.gz
zhwiki-latest-stub-meta-current.xml.gz-rss.xml
zhwiki-latest-stub-meta-current1.xml.gz
zhwiki-latest-stub-meta-current1.xml.gz-rss.xml
zhwiki-latest-stub-meta-current2.xml.gz
zhwiki-latest-stub-meta-current2.xml.gz-rss.xml
zhwiki-latest-stub-meta-current3.xml.gz
zhwiki-latest-stub-meta-current3.xml.gz-rss.xml
zhwiki-latest-stub-meta-current4.xml.gz
zhwiki-latest-stub-meta-current4.xml.gz-rss.xml
zhwiki-latest-stub-meta-history.xml.gz
zhwiki-latest-stub-meta-history.xml.gz-rss.xml
zhwiki-latest-stub-meta-history1.xml.gz
zhwiki-latest-stub-meta-history1.xml.gz-rss.xml
zhwiki-latest-stub-meta-history2.xml.gz
zhwiki-latest-stub-meta-history2.xml.gz-rss.xml
zhwiki-latest-stub-meta-history3.xml.gz
zhwiki-latest-stub-meta-history3.xml.gz-rss.xml
zhwiki-latest-stub-meta-history4.xml.gz
zhwiki-latest-stub-meta-history4.xml.gz-rss.xml
zhwiki-latest-templatelinks.sql.gz
zhwiki-latest-templatelinks.sql.gz-rss.xml
zhwiki-latest-user_groups.sql.gz
zhwiki-latest-user_groups.sql.gz-rss.xml
zhwiki-latest-wbc_entity_usage.sql.gz
zhwiki-latest-wbc_entity_usage.sql.gz-rss.xml
—以上未簽名的留言由维基小王子對話貢獻)於2017年9月7日 (四) 02:25 (UTC)加入。[回复]

维基百科导出

[编辑]


维基百科数据库的导出/下载能否统一成一种变体或者增加变体选项,比如zh-cn的数据就是纯简体且文章内文使用zh-cn的地区词。目前下载的内容应该是繁简体和地区词混用,条目中一个名词使用多个不同的称呼。--Kethyga留言2024年11月15日 (五) 11:07 (UTC)[回复]

字词转换是mediawiki的功能,数据库是数据库,导出后一般也是在其它使用mediawiki或类mw的站点使用,感觉不该在数据库层面上转换。未登录用户的页面是按变体分别生成的缓存,但不知道在哪里获取。——暁月凛奈 (留言) 2024年11月15日 (五) 11:17 (UTC)[回复]
从里面找了一段
<sublink linktype="nav"><anchor>符号、语言与精确性</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#符號、語言與精确性</link></sublink>
<sublink linktype="nav"><anchor>数学作为科学</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#數學作為科學</link></sublink>
<sublink linktype="nav"><anchor>数学的各领域</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#數學的各領域</link></sublink>
<sublink linktype="nav"><anchor>基础与哲学</anchor><link>https://zh-two.iwiki.icu/wiki/%E6%95%B0%E5%AD%A6#基礎與哲學</link></sublink>
源代码和渲染后的都有,不清楚“目前下载的内容应该是繁简体和地区词混用”具体是什么情况。——暁月凛奈 (留言) 2024年11月15日 (五) 11:22 (UTC)[回复]
比如这篇wikipedia-to-zh-cn、[Wikiwand 泰勒·斯威夫特](Taylor Swift)、IPFS版(使用的Kiwix),如果导出的内容不是在维基系统中使用,就是繁简体和地区词混用。--Kethyga留言2024年11月15日 (五) 12:41 (UTC)[回复]
IPFS那个应该是抓网页的(可能是移动版或者新Vector),另外提供那个是拿数据库生数据再用自己的转换库去改的(没有套用mw的转换)。这些原始数据需要自行处理。数据库dump就真是数据库dump罢了。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月16日 (六) 03:22 (UTC)[回复]
繁簡混用的话,转换还比较简单,地区用词混用的话,在维基系统之外使用就比较受限,特别是同一页面中用不同名称称呼一个概念。--Kethyga留言2024年11月16日 (六) 04:49 (UTC)[回复]
具体指怎样的导出方式?技术上不支持,数据库存储的源代码就是简繁混合的,字词转换涉及MediaWiki程序及转换表、模块/模版。如果要抓转换后结果,只能抓网页/API。--YFdyh000留言2024年11月15日 (五) 11:56 (UTC)[回复]
技术上存入数据库的wikicode都是繁简混合并且未套用各种转换机制(四层转换表)的,只有经过mw解析器的套用后才有各种变体的显示效果。所以要么用网页抓取,要么自己拆解解析器的代码来改。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月16日 (六) 03:15 (UTC)[回复]