Files
Obsidian/博客/数据分析与报告/博客爬取报告.md
T

176 lines
4.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: 博客爬取报告
slug: bo-ke-pa-qu-bao-gao
cover: ""
categories: []
tags: []
halo:
site: https://blog.metarl.cc.cd
name: e826f389-79f7-451e-8deb-fcbf88786314
publish: true
---
# Serendipity 博客信息爬取报告
> 爬取时间:2026-04-23
> 博客地址:http://101.133.128.193:8091/
> 公开域名:https://blog.metarl.cc.cd
---
## 📋 基本信息
| 项目 | 内容 |
|---|---|
| **博客名称** | Serendipity |
| **标语** | AI技术分享 × 行业动态 × 创新实践 |
| **副标题** | 知识的星辰照亮你的AI学习之旅 |
| **组织名称** | 河南工业大学人工智能协会 |
| **邮箱联系** | 3364451258@qq.com |
| **服务器地址** | 101.133.128.193:8091 |
| **公开域名** | https://blog.metarl.cc.cd |
---
## 🔧 技术信息
### 平台版本
- **Halo版本**v2.24.0
- **主题名称**Serenity
- **主题版本**v1.5.11
- **部署环境**:阿里云服务器
### 主题特性
- **主题类型**:Serenity(清新简约风格)
- **字体支持**Noto Sans SC, PingFang SC, Microsoft YaHei, LXGW WenKai等多种中文字体
- **默认主题**:自动切换(支持亮色/暗色模式)
- **动画效果**AOSAnimate On Scroll)滚动动画
- **平滑滚动**:Lenis平滑滚动库
- **轮播组件**Swiper轮播组件
### 插件功能
1. **在线状态监控插件**:实时显示网站在线状态和活跃页面数
2. **LivePhoto嵌入插件**:支持LivePhoto内容嵌入
3. **OAuth2社交登录**:支持GitHub账号登录
4. **音乐面板**:集成音乐播放功能
5. **留言板功能**:访客留言系统
6. **搜索功能**:全文搜索支持
---
## 📜 法律文档
### 隐私政策
- **更新时间**2026年4月2日
- **适用范围**:个人信息保护、账户信息、位置信息等
- **合规标准**:符合GDPR/CCPA要求
### 服务条款
- **更新时间**2026年4月2日
- **主要内容**
- 用户账户注册与管理
- 用户行为规范
- 知识产权声明
- 免责声明
- 争议解决机制
---
## 🎯 网站功能
### 用户功能
- ✅ 用户注册
- ✅ 用户登录
- ✅ 记住登录状态
- ✅ 密码重置(通过邮箱)
- ✅ GitHub社交登录
- ✅ 留言板互动
### 内容管理
- ✅ 文章发布与浏览
- ✅ 分类系统
- ✅ 标签系统
- ✅ 评论区
- ✅ 站点搜索
### 特色功能
- 🎵 音乐播放面板
- 📸 LivePhoto内容嵌入
- 🌙 暗色/亮色主题切换
- 📱 响应式设计
- ⚡ 平滑滚动体验
---
## 📊 技术架构
### 前端技术
- **UI框架**:自定义CSS + Normalize.css
- **动画库**AOS、Lenjs、Swiper
- **Markdown渲染**Marked.js
- **安全加密**JSEncrypt(密码加密传输)
### 安全特性
- **CSRF保护**:启用CSRF令牌验证
- **密码加密**:使用RSA公钥加密登录密码
- **安全Headers**X-UA-Compatible等安全头
### SEO优化
- **Sitemap**:支持sitemap.xml
- **RSS订阅**:支持rss.xml和atom.xml
- **语义化HTML**:使用语义化标签
- **移动适配**:响应式设计支持各种设备
---
## ⚠️ 爬取说明
### 获取到的信息
1. ✅ 博客基本信息(名称、标语、联系方式)
2. ✅ 技术版本信息(Halo版本、主题版本)
3. ✅ 法律文档内容(隐私政策、服务条款)
4. ✅ 网站功能特性
5. ✅ 技术架构信息
### 限制与局限
- ⚠️ API接口需要认证,无法获取完整文章列表
- ⚠️ 部分中文内容存在编码问题
- ⚠️ 无法获取受保护的统计数据(如访问量等)
- ⚠️ 评论内容需要登录后才能查看
### 建议
如果需要获取完整的文章列表和更多内容,建议:
1. 登录管理后台获取API令牌
2. 使用Halo官方API文档进行认证访问
3. 直接登录Halo管理后台(/admin)查看完整内容
---
## 📝 备注
本报告完全基于公开可访问的网页内容爬取生成,所有信息均来自:
- 网站首页
- 登录页面
- 法律文档(隐私政策、服务条款)
- HTML元数据
未进行任何未授权的入侵或破解操作。
---
**生成时间**2026-04-23
**工具**PowerShell + Invoke-WebRequest