GithubHelp home page GithubHelp logo

simplecd's People

Contributors

observerss avatar

simplecd's Issues

更新fetchvc.py中的正则表达式匹配

这个项目好久没有更新了,vecycd网页的模板发生了一些变化��
�导致fetchvc.py不能正常工作。所以根据verycd新的网页模板,修
改了fetchvc.py中fetch函数内部相应的正则表达式,使得fetchvc.py�
��新正常工作。

注:论坛现在怎么不能注册,难道这个项目要就这么死掉了��
�?

Original issue reported on code.google.com by [email protected] on 5 Sep 2011 at 2:24

Attachments:

在基于Debian6.0运行apache2的服务器上架设SIMPLECD

此文感谢
http://www.simplecd.org
感谢Observer的无私奉献,你是我的偶像
请先参考Observer的Ngnix环境下的架设的视频,半个小时的视频�
��看了三遍。。
感谢以下链接
http://www.simplecd.org
Observer视频教程
Web.py官网教程
Simplecd google code
Simplecd Deployment
百无聊赖中,发现simplecd.org的老大提供了架站源码和数据库��
�惊喜!惊艳!崇拜!!
想起来自己也曾经在那个btchina被封,verycd风雨飘摇的时候想�
��备份所有verycd上的资源链接,但只抓过几十M的数据就放弃��
�。。。能力太低
现在这个机会太好了。决定搞
ACC想在自己的网站上把SIMPLECD放上去。虽然是无评论无图精简
版,但聊胜于无。万一哪天,连simplecd.org也被封杀了,好歹��
�个念想。
可惜,OBSERVER大只提供了简单的Nginx+python的环境下架设SIMPLECD�
��教程。
而自己的服务器是一台图拉丁512M的老机器,装了Debian6.0,有a
pache2+mysql+php5环境。老机器同时运行Nginx和apache2多累啊。。。
网上资料虽然有,但是我水平实在低啊。。。什么前端后端��
�律不懂
而且我只是想把SIMPLECD当前现成可以用的数据库放上去,没想
着可以自动爬更新什么的。
自己的域名下,通过子目录提供了几个服务,比如
<恕我不敢把自己的主机地址放出来,服务器性能太低实在伤�
��起,只能自己和朋友偷偷用>
http://www.mysite.com/bbs
http://www.mysite.com/wordpress
现在的目标是弄一个
http://www.mysite.com/simplecd
我的修改方法如下,记录下来就当我自己的备忘好了。

*已有的环境
Debian6.0+apache2+mysql+php5
已经有一个虚拟站点http://www.mysite.com在正常运行
已经有如下子目录可以正常运行,比如http://www.mysite.com/bbs
开始了
一、安装sqlite3支持
#apt-get install sqlite3
二、似乎要有python支持,忘记了是不是用了下面的这个命令
#apt-get install python
三、安装web.py 0.33版本(Observer指定的版本)
#cd ~
#wget http://webpy.org/static/web.py-0.33.tar.gz
#tar xvzf web.py-0.33.tar.gz
#cd web.py-0.33
#python setup.py install
然后可以删除这些文件了
#cd ~
#rm -r web.py-0.33
#rm web.py-0.33.tar.gz
四、在自己的虚拟站点(比如www.mysite.com)的目录下建立simplecd��
�目录,从Observer大大的源站把他的源码下载下来。
Observer的源码地址:
https://simplecd.googlecode.com/hg
这步可以手动,
#cd /home/www/mysite.com/public_html (根据自己的路径调整)
#mkdir simplecd
#cd simplecd
然后把源码中的所有子目录和文件以及子目录中的文件一模��
�样放在复制粘贴到这个新建的simplecd目录中
或者用Observer的教程中推荐的方法
#apt-get install mercurial
#cd /home/www/mysite.com/public_html
#hg clone https://simplecd.googlecode.com/hg simplecd
#cd simplecd
接下来的一步我没做,因为,Observer大大似乎已经取消这个dev
-sqlit分支了吧?
#hg update dev-sqlite (我没做这一步)
好了,接下去的这些步骤是我自己摸索着搞出来的
五、添加.htaccess文件,让apache2支持运行web.py。web.py官网推荐�
��一长排的方法,偶偷懒用了最easy的一种,但肯定不是最高��
�或者安全的一种。反正自己的服务器,无所谓了
1. 确定进入了这个simplecd子目录
#cd /home/www/mysite.com/public_html/simplecd
2. 创建.htaccess
#nano .htaccess
按鼠标右键,粘贴下面这三行
Options +ExecCGI
AddHandler cgi-script .py
DirectoryIndex index.py/
按ctrl+o保存,按ctrl+x退出nano
六、修改simplecd子目录中的源文件
1. 确定进入了这个simplecd子目录
#cd /home/www/mysite.com/public_html/simplecd
2. 把code.py改名为index.py,我用了个复制命令
#cp code.py index.py
3. 给index.py赋予权限
# chmod +x index.py
4. 进入templates目录修改index.html, id.html
这一步工作了比较大,修改的原因是Observer的网页源码是为类
似http://www.mysite.com写的,里面的链接都是形如http://www.mysite.co
m/?id=123,而我现在要统统改为http://www.mysite.com/simplecd/?id=123
简单说就是把/开始的绝对路径改为./开始的相对路径
#cd /home/www/mysite.com/public_html/simplecd/templates
#nano index.html
把里面比如
"/static/main_02.css"
改为
"static/main_02.css"
a href=/
改为
a href=./
"$arg=$pages[0]"
改为
".$arg=$pages[0]"
很多地方哦,慢慢改
改完后按ctrl+o保存,按ctrl+x退出nano
接着改id.html
#cd /home/www/mysite.com/public_html/simplecd/templates
#nano id.html
一样的人肉修改(好吧,其实是我不会用linux下面的查找替换)
改完后按ctrl+o保存,按ctrl+x退出nano
最后修改static子目录下面的hot.html
#cd /home/www/mysite.com/public_html/simplecd/static
#nano hot.html
形如
"_parent" href="/?id=2786367"
改为
"_parent" href="../?id=2786367"
改完后按ctrl+o保存,按ctrl+x退出nano
全部改完了以后,回到这个目录
#cd /home/www/mysite.com/public_html/simplecd/
回来干嘛?
数据库还没有呢!!去Observer大提供的地方下载,然后一直upd
ate到他最新的包
verycd.sqlite3.db这个数据库想办法放进/home/www/mysite.com/public_html/
simplecd/
到这里应该完成了,浏览器打开http://www.mysite.com/simplecd就能��
�开架设在自己服务器上的simplecd了

Original issue reported on code.google.com by [email protected] on 25 Apr 2011 at 4:27

查找太慢

网页版搜索太慢,不知道是web.py的db的问题还是sqlite没有配置
好,经常超时。现在都是在sqlite里select 
verycdid然后直接在浏览器里输入verycdid做的,有点麻烦。为什�
��simplecd.org官网这么快,有什么特别处理么?

Original issue reported on code.google.com by [email protected] on 14 May 2011 at 5:15

关于安装步骤

按步骤一一做完,却不能运行,后来发现是需要加上这个:

sudo apt-get install python-setuptools
sudo easy_install web.py
sudo easy_install flup

Original issue reported on code.google.com by [email protected] on 23 Dec 2009 at 1:54

并发锁死现象(Deadlock when high concurrent writings to db)

What steps will reproduce the problem?
1. 运行fetchvc脚本抓网页(不时有数据库写入操作)
2. 同时网站不停地搜索,高并发
3. 
这样在写入事可能遇到搜索的lock导致失败,写入进程崩溃,�
��时保有lock的进程也一起崩
溃,于是网站出现internal error

Original issue reported on code.google.com by [email protected] on 20 Dec 2009 at 2:53

fetch的时候发生段错误

What steps will reproduce the problem?
我的环境是python2.5,运行的版本为33:1056c1a66b4b。
在运行fetchvc.py update的时候经常段错误。

好像是这个造成的:
def dbfind(id,conn):
    c = conn.cursor()
    c.execute('select 1 from verycd where verycdid=?',(id,))
    c.close()  #~~~~~~~~~~--> 把这行放到后面执行就没问题了。
    for x in c:
        if 1 in x:
            return True
        else:
            return False


Original issue reported on code.google.com by [email protected] on 21 Dec 2009 at 10:44

关于资源的状态

自从vc挂过一次后,也研究了下vc的资源页,并下载的绝大部�
��的资源页,准备用于提取关键内
容到数据库,其中发现过的问题分享下。
从首页进入看到的资源都是精华,如果要获取普通资源,需��
�用户登录,并进入“候选区”才能
看到所有的资源内容,包括精华及普通资源。
关于其他问题能否给我的gmail邮箱发送下你的qq号,以便取得�
��时沟通?

Original issue reported on code.google.com by [email protected] on 20 Dec 2009 at 11:56

hg2git?

can you let the project to github?

Original issue reported on code.google.com by [email protected] on 30 Sep 2012 at 6:49

[功能请求]增加utf8支持

linux下默认的编码一般是utf8,使用amule下载verycd上的资源常常
遇到文件名乱码的问题,虽然通过更改编码设置可以解决这��
�问题,但是对与新手来说还是有很多不方便。可否在抓取之�
��做一下编码转换,提供一个utf8版本的simplecd呢?utf8应该是��
�来的趋势,我不太清楚如果编码改成utf8的话在windows下会不��
�乱码,如果不会的话,不如只维护一个utf8版本的simplecd就好�
��。

Regards :)

Original issue reported on code.google.com by [email protected] on 11 Aug 2010 at 6:36

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.