git撤回commit

git reset --soft HEAD^
```sql
select column_name from information_schema.columns where table_name = "metadata_table1"

查询某表的所有列名

清除爬虫所收集网页中的重复网页的方法:使用余弦相似度计算两条新闻向量余弦值,大于等于某一个阈值就认为是重复网页,去除。