教务系统的奇葩数据

课程信息表

{
  "klass": {
    "course_code": "231302Z11",
    "course_name": "人体形态学实验 B1",
    "klass_code": "019460",
    "klass_name": "生信1601",
    "c_num": "1",
    "s_num": "18",
    "credit": "1.5",
    "org": "形态学实验中心",
    "jxid": "E0AAAC1D162044D5A5C5E499E7CB6B1B"
  },
  "teachers": "肖玲副教授",
  "parts": [
    {
      "week_s": "2-18/全周",
      "week_p": "301020304",
      "room_s": " "
    }
  ]
}

该示例中无上课地点,课程时间为两节课合并

{
  "klass": {
    "course_code": "22100081",
    "course_name": "疾病学概论Ⅱ",
    "klass_code": "019467",
    "klass_name": "生信1501",
    "c_num": "1",
    "s_num": "15",
    "credit": "5",
    "org": "湘雅三医院教学部",
    "jxid": "2728712012"
  },
  "teachers": "李小荣教授",
  "parts": [
    {
      "week_s": "1-18/全周",
      "week_p": "205060708",
      "room_s": "T212"
    }
  ]
}
{
  "klass": {
    "course_code": "22100081",
    "course_name": "疾病学概论Ⅱ",
    "klass_code": "017791",
    "klass_name": "检验1501-3",
    "c_num": "3",
    "s_num": "76",
    "credit": "5",
    "org": "湘雅三医院教学部",
    "jxid": "2728712012"
  },
  "teachers": "李小荣教授",
  "parts": [
    {
      "week_s": "1-18/全周",
      "week_p": "205060708",
      "room_s": "T212"
    }
  ]
} 

明明是同时上课,但是行政班编号表示不是同一个班

{
  "klass": {
    "course_code": "22201011",
    "course_name": "临床麻醉学[实验学时]",
    "klass_code": "022759",
    "klass_name": "14麻醉附一1组",
    "c_num": "1",
    "s_num": "0",
    "credit": "3",
    "org": "麻醉医学系",
    "jxid": "2202752012"
  },
  "teachers": "  ",
  "parts": [
    {
      "week_s": "6-13/全周",
      "week_p": "301020304",
      "room_s": " "
    }
  ]
}

课程名字旁有’[实验学时]’、’[实践学时]’、’[讲课学时]'的字样,但是学生看不到这些标签,而且学生课表上没有实践学时。同时,实践课程没有老师,没有授课地点,导致其他关键信息重复率极高

{
  "klass": {
    "course_code": "130210Z1",
    "course_name": "物流优化",
    "klass_code": "004715",
    "klass_name": "信科1401-2班,应数1401-3班,统计1401-3",
    "c_num": "8",
    "s_num": "100",
    "credit": "3",
    "org": "信息与计算科学系",
    "jxid": "0006062012"
  },
  "teachers": "万中教授",
  "parts": [
    {
      "week_s": "1-8/全周",
      "week_p": "50708",
      "room_s": "D座121"
    }
  ]
},
{
  "klass": {
    "course_code": "110210Z1",
    "course_name": "物流管理信息系统",
    "klass_code": "004394",
    "klass_name": "物流1501",
    "c_num": "1",
    "s_num": "23",
    "credit": "2",
    "org": "物流系",
    "jxid": "1102042012"
  },
  "teachers": "王美云副教授",
  "parts": [
    {
      "week_s": "1-8/全周",
      "week_p": "30304",
      "room_s": "世主506"
    }
  ]
}

自习观察可以发现行政班名称上有使用’xxxx班’还有使用’xxxx’的,该情况为上课班级的解析增加难题

综上所述

  1. 课程名会多东西
  2. 行政班名称缺乏规范
  3. 上课节次会出现多节连接
  4. 课程地点可能为空

学生课表

  1. 体育课的名字上多出“男”字样,如:“体育(三)[男]”,“体育(三)[女]”
  2. 课程表上的名字存在"-重修班-重修",“–辅修”
  3. 老师的职称重复,乱序或拼接,无法解析

教师信息

{
  "code": "2963",
  "name": "刘哲宁",
  "unit": "湘雅二医院",
  "title": "未定",
  "qualification": "",
  "degree": ""
}

教师的职称可以叫未定,可以没有文凭,没有学历

{
  "code": "138999",
  "name": "刘宏伟*",
  "unit": "资源加工与生物工程学院",
  "title": "",
  "qualification": "",
  "degree": ""
}

教师的名字上有’*'标记,教师的职称可以为空